סיכום מחקר סלקציה גנומית לפי מערך של 54,000 סמנים גנטיים

 

מחקר מספר 983-0015, שנת 2008-2010


יהודה ולר1, אפרים עזרא2, יואל זרון3, ומיכה רון1


1המחלקה לבקר וגנטיקה, מינהל המחקר החקלאי
2התאחדות מגדלי בקר
3שיאון

 


תקציר מנהלים
בשנת 2008 הוחלט ע"י ועדת ספר העדר והטיפוח להסב את תכנית הטיפוח הישראלי מתכנית המבוססת על בחירת פרים צעירים לפי מבחן צאצאים לתכנית המבוססת על סלקציה גנומית של פרים צעירים. הבסיס להחלטה היה פיתוח תשתית של שבב דנא של חברת Illumina"", הכולל 54,001 סמנים גנטיים המפוזרים על פני 30 הכרומוזומים של הבקר, כשני סמנים בממוצע בכל גן. בשנת 2010 שופר השבב על ידי החלפת סמנים גנטיים לא תקינים. עד סוף 2010, נקבעו גנוטיפים עבור 1,143 פרים. 912 פרים מופו לפי שבב ישן ו-256 לפי שבב חדש. 25 פרים מופו לפי שני השבבים. הפרים נולדו בין 1975 ו-2009. ל-995 הפרים קיים מבחן צאצאים ויש להם הישנות מעל 50% עבור תכונות יבול חלב, רת"ס, פוריות, והתמדה. הדנא הופק במעבדה של היחידה לגנטיקה במכון וולקני לפי הנחיות חברת Illumina. היברידיזציה של השבבים, עם דנא של הפרים, בוצעה בשבב הישן על ידי היחידה של ד"ר שיין ממכון רפפורט המוסמך על ידי חברת Illumina"" ובשבב החדש בחברת "GeneSeek", לינקולן, נברסקה, ארה"ב. עבור כל תכונה נבחרו 400 הסמנים בעלי ההשפעה הגבוהה ביותר לפי מודל הכולל השפעת הסמן והיחסים הגנטיים בין הפרים. לפרים בני 5 עד 8 שנים נאמד הקשר בין אומדן ההורשה של הפר על פי אילן יוחסין של הפר (שיטה נוכחית) ואומדן ההורשה המשלב את המידע הגנומי (שיטה עתידית) לבין אומדן ההורשה על סמך ביצועי בנותיו (מבחן צאצאים). נמצא: (א) תוספת המידע הגנומי היתה משמעותית, (ב) תוספת המידע הגנומי הקטינה את ההטייה לכדי מינימום (כ-30 יחידות אינדקס), (ג) תוספת המידע הגנומי עדיין לא מספקת (מקדם קביעה 0.15) כדי לבטל את תוכנית ההמתנה ומבחן צאצאים. על פי המדווח בעולם, באוכלוסיות שמופו מעל 5,000 פרים ניתן להגיע למקדם קביעה של 50-70%, ועדיין המסקנה היא להמשיך בתוכנית ההמתנה. כמו כן ניתנות המלצות ליישום מיידי עבור 132 פרים עד גיל 4 שנים שיש להם גנוטיפים ועדיין אין להם מבחן צאצאים. לפרים אלו חושב אומדן הורשה על בסיס מידע גנומי וניתן להשתמש בערכים אלו לסלקציה של: (1) פרים נמוכים מאוד המיועדים להוצאה ו-(2) פרים גבוהים מאוד להזרעה מוגברת.


קביעת גנוטיפים תקינים
מתוך 54,609 סמנים בשבב החדש, 52,340 סמנים היו גם בשבב הישן. היות ונבדקו רק 256 פרים בשבב החדש, החלטנו לפסול את הסמנים שהופיעו בשבב החדש אך לא בישן. מתוך 61,723,143 צרופים פר∗סמן (54,001 סמנים כפול 1143 פרים) היו 1,062,709 גנוטיפים לא מפוענחים (1.7%). כמו כן חסרו 425,216 גנוטיפים עבור 1661 סמנים שנוספו בשבב החדש. לפי הנחיית חברתIllumina נפסלו קריאות עם "איכות קריאה" הנמוכה מ-70%. לאחר סינונים אלו נותרו 51,199,670 גנוטיפים תקינים (83%).
נפסלו סמנים בהם תדירות האלל הנדיר נמוכה מ-5%, סמנים עם גנוטיפים תקינים עבור פחות ממחצית הפרים וסמנים עם זהות בגנוטיפים מעל 0.95 עם הסמן העוקב בכרומוזום, בהנחה שאלו סמנים זהים. נותרו 40,094 סמנים תקינים מתוך 54001 (74%). וואן-רדן ושות' (2009) קיבלו תוצאות מאוד דומות על אוכלוסיית ההולשטיין של ארה"ב. מתוך הסמנים האלה היו 692 בכרומוזומי המין, ו-420 סמנים לא ממופים. עבור יתרת הסמנים שמופו לכרומוזומי הגוף (אוטוזומים) נבדקה סטיית התפלגות הגנוטיפים מהצפוי לפי חוק הרדי-ווינברג. סטייה משמעותית יכולה להעיד על טעות שיטתית בקביעת הגנוטיפים. היו רק 48 סמנים עם סטייה הגדולה מ-20% בין שיעור ההטרוזיגוטים הצפוי למצוי.


מדגם הפרים וטעות בזיהוי אבהות
עד סוף 2010, נקבעו גנוטיפים עבור 1,143 פרים בשבב ה-דנא של חברת Illumina"", הכולל 54,001 סמנים גנטיים המפוזרים על פני 30 הכרומוזומים של הבקר, כשני סמנים בממוצע בכל גן בגנום הבקר 912 פרים מופו לפי שבב ישן ו-256 לפי שבב חדש. 25 פרים מופו לפי שני השבבים. הפרים נולדו בין 1975 ו-2009. התפלגות הפרים לפי שנת לידה מופיע בגרף 1. ל 995 הפרים קיים מבחן צאצאים ויש להם הישנות מעל 50% עבור תכונות יבול חלב, רת"ס, פוריות, והתמדה.

 


בקובץ הנתונים היו 670 פרים ואבותיהם אשר נבדקו על גבי השבב. עבור הפרים שנבדקו בשבב הישן, 20 בדיקת האבהות הראתה חוסר התאמה עם האב הרשום בספר העדר. 25 פרים שנבדקו בשבב הישן נבדקו גם בשבב החדש, 20 הפרים עם חוסר התאמה בין גנוטיפ הפר והאב הרשום, שניים בגלל שהגנוטיפים הראשונים היו גרועים, ושלושה בגלל חשש של טעות בזהות הפר במעבדה. מתוך ה-20 פרים עם חוסר התאמה עם האב, 18 חזרו עם זהות כמעת מוחלטת של גנוטיפים. עבור שניים הנוספים היו כ-40% גנוטיפים שונים בשבב החדש. כלומר, הייתה טעות בזיהוי הפר. לפי הגנוטיפים החדשים, אחד מהפרים התאים לאב, אבל השני לא. מתוך שלושת הפרים ה"חשודים", לשנים מהם הייתה טעות בזיהוי. עבור בפרים שנבדקו רק בשבב החדש, היו חמישה עם חוסר התאמה לאב הרשום. כלומר סה"כ 24 פרים עם חוסר התאמה מתוך 670 (3.6%). עבור רב הפרים האלה אימות האבהות המקורי התבצע בתקופה בה בדיקות האבהות היו בעלות עוצמה יחסית נמוכה. מתוך 24 הפרים האלה הצלחנו לקבוע את האב הנכון ב-18 מקרים.


קביעת השפעות הסמנים על התכונות הכלכליות
קביעת השפעת הסמנים נקבעת בשלבים בגלל מגבלת כוח מחשוב. המצב הטוב ביותר היה להריץ את המבחן הגנטי עם 54,000 סמנים במודל אחד אולם טכנית במערכת הקיימת לא ניתן לבצע זאת. כנ"ל גם לגבי שיטת הנראות המרבית, REML. בעולם שיטת VanRaden (2008) הנפוצה הריצה על מטריצת כל הסמנים אולם לכל פר יש רק רשומה פנוטיפית אחת , DYD (Daughters yield deviation) ממוצע בנות הפר לתכונה המתוקנת לרמה הגנטית של העדר.


קביעת השפעת הסמנים על התכונות הכלכליות נאמדה באופן הבא:
1. נקבעו השפעת כל סמן על התכונות לפי מודל ליניארי הכולל את השפעת אלל הסמן והשפעת שנת הלידה של הפר. נבדקו 13 תכונות:ק"ג חלב, שומן וחלבון, אחוז שומן וחלבון, רת"ס (לוג סת"ס), פוריות נקבית, הישרדות, התמדה, אופן המלטה, תמותת וולדות, שיעור תאומים, ואינדקס הטיפוח 11PD.
2. בשלב השני עבור כל תכונה ניתחנו את 2,000 ההשפעות המובהקות ביותר לפי שיטת REML (נראות מירבית מוגבלת) במודל הכולל גם את השפעת התורשה הכמותית לפי מטריצת הקשרים הגנטיים בין הפרים. בכל ניתוח נכללו ההורים והסבים של כל פר עם גנוטיפ. נבחרו לכל תכונה 400 סמנים המובהקים ביותר.
3. הורץ מבחן גנטי לכל תכונה בנפרד לפרים ופרות הכולל את 400 הסמנים שנבחרו. המבחן הגנטי כולל את כל הרשומות הפנוטיפיות. הגורמים במודל היו השפעת הפרה כהשפעה אקראית וגורם והשפעות העדר-עונה והסמנים כהשפעות קבועות. ומתוך תוצאות המבחן מחושב לכל תכונה השפעות הסמנים.


בטבלא 1 מסוכמות השפעות הסמנים על התכונות במבחן. המשתנה התלוי הוא אומדן ההורשה של הפר על סמך בנותיו. המשתנה המסביר הוא סכום ההשפעות לכל פר ל-400 הסמנים מתוך המבחן הגנטי. לכל התכונות אומדן ההורשה בעל מהימנות גבוהה, הישנות ממוצעת גבוהה מ-90%, להוציא פוריות והישרדות עם הישנות מעל 80%.


טבלא 1: רגרסיות ומקדמי הקביעה בין סכום השפעות 400 סמנים וא"ה הנוכחי של 916 פרים.


תוצאות מהטבלא מראות:
מקדם הקביעה לתכונות ייצור ק"ג חלב, שומן, חלבון, התמדה והישרדות בתחום של 0.35 ועד 0.45. פוריות בנות ורת"ס נמוך יותר 0.10, 0.19 בהתאמה. מתוך מפת ההשפעות לגזע ההולשטיין במיפוי הבקר אמריקאי הנמצאת באתר:

 http://aipl.arsusda.gov/Report_Data/Marker_Effects/marker_effects.cfm?Breed=HO נראה שיש התאמה לממצאים. לרת"ס כמעט ואין השפעות "חזקות", כנ"ל לפוריות. לתכונות האחרות ישנן השפעות "חזקות".


אימות ושימוש בתוצאות לטיפוח
קובץ הנתונים המשמש את מבחן הפרים קוצץ לפרות שהמליטו עד אוקטובר, 2006. כתוצאה מקיצוץ קובץ הנתונים התקבל קובץ חלקי בו היו 673 פרים עם גנוטיפים לסמנים, אומדני הורשה על סמך ביצועי בנות, ואומדן הורשה לאם על בסיס לפחות רשומה אחת.
עבור פרים אלה נקבעה "נוסחת חיזוי" של א"ה ע"י מודל רגרסיה; המשתנה התלוי היה א"ה של הפר על סמך בנותיו והמשתנים הבלתי תלויים היו ממוצע א"ה של ההורים, סכום השפעת הסמנים ושנת לידת הפר. מקדמי הרגרסיה של הגורמים במודל על פי הקובץ החלקי מופיעים בטבלה 2.


טבלא 2 - מקדמי הרגרסיה של הגורמים במודל על פי הקובץ החלקי, 673 פרים.


מסקנות מהטבלא:
(1) מקדמי הקביעה היו בין 0.62-0.71.
(2) עבור כל התכונות ממוצע א"ה וסכום השפעות הסמנים היו מובהקים, 0.0001>p.
(3) חותך ציר Y והשפעת שנת הלידה היו לחלק מהתכונות לא מובהקים ולאחרות בעלות מובהקות גבולית. רב השפעת הנטייה הגנטית נבלע בהשפעות ממוצע הורים וסכום הסמנים.
א"ה גינומיים נקבעו עבור ל-79 פרים שהיה להם מבחן על סמך בנותיהם בקובץ המלא לכל התכונות באינדקס ע"י יישום נוסחת הרגרסיה מנתוני הקובץ החתוך. א"ה הגינומיים הושוו לא"ה הנחשב כממוצע א"ה של ההורים וא"ה מהקובץ המלא, הכולל רשומות הבנות של הפרים האלה. ממוצעים פשוטים ל-79 פרים, חמ"ם 2011 מופיעים בטבלא 3, ומתאמים בין א"ה לפי שלוש השיטות מופיעים בטבלה 4.


טבלא 3– ממוצעים פשוטים ל-79 פרים, חמ"ם 2011.


טבלא 4– מתאמים בין אומדני הורשה ל- חמ"ם 2011 לפי שלוש השיטות.


מתקבל מטבלאות 3 ו-4:
(1) ההפרש בין ממוצע אומדן הורשה משולב סמנים לאומדן הורשה על סמך בנות כ-30 יחידות לעומת כ-95 יחידות אומדן הורשה על סמך הורים. כלומר תוספת המידע הסמני הקטינה והפכה את הכיוון של ההטיה יחסית לא"ה הנוכחיים.
(2) ככל שמהימנות א"ה גבוהה יותר, סטיית התקן צריכה להיות גבוהה יותר. מתקבל שסטיית התקן של א"ה הכולל את המידע הסמני גבוהה יותר מאשר על סמך הורים בלבד.
(3) המתאם בין א"ה הכוללים את המידע הגנומי לבין א"ה על סמך בנות שווה ל 0.39 וגבוה מאשר על סמך הורים בלבד, 0.27.


טבלא 5– רגרסיה בין אומדני הורשה לחמ"ם לאומדן על סמך בנות הפר (מבחן צאצאים)


מטבלת הרגרסיה מתקבל:
(1) מידת ההטיה (חיתוך) דומה בשני האומדנים.
(2) מקדם הקביעה לפי סמנים גבוה יותר מאשר האומדן על פי הורים.


סיכום פרק האימות:
(1) תוספת המידע הגנומי משמעותי.
(2) תוספת המידע הגנומי הקטינה את ההטייה לכדי מינימום (כ-30 יחידות אינדקס)
(3) תוספת המידע הגנומי עדיין לא מספקת (מקדם קביעה 0.15) בכדי לבטל את תוכנית ההמתנה ומבחן צאצאים. על פי המדווח בעולם, באוכלוסיות שמופו מעל 5,000 פרים ניתן להגיע למקדם קביעה של 50-70%, ועדיין המסקנה היא להמשיך בתוכנית ההמתנה.


יישום:
באנליזה גנומית היו 132 פרים שכל המידע היה על סמך ההורים והסמנים. פרים אלו צעירים, עד גיל 4 שנים. לפרים אלו חושב אומדן הורשה מבוסס סמנים וניתן להשתמש בערכים אלו בשני אופנים: (1) פרים נמוכים מאוד המיועדים להוצאה ו-(2) פרים גבוהים מאוד להזרעה מוגברת.


ספרות


VanRaden, P.M. 2008. Efficient methods to compute genomic predictions. J. Dairy Sci. 91:4414–4423.
VanRaden, P. M., C. P. Van Tassell, G. R. Wiggans, T. S. Sonstegard, R. D. Schnabel, J. F. Taylor & F. S. Schenkel. 2009. Invited review: Reliability of genomic predictions for North American Holstein bulls. J. Dairy Sci. 92:16–24.


תקציר באנגלית


In 2008 the Breeding and Herdbook Committee of the Israel Cattle Breeders Association decided to upgrade the Israeli breeding program from a progeny test scheme to a scheme based on genomic selection of young bulls. This decision was based on the release of the Illumina Inc. DNA BovineSNP50 BeadChip, which includes 54,001 genetic markers distributed throughout all 30 bovine chromosomes, with approximately 2 markers per gene. In 2010 Illumina Inc. replaced the BovineSNP50 BeadChip with the BovineSNP50 v2 BeadChip, which contains 54,609 markers. Of the original 54,001 markers, 52,340 were included in the v2 BeadChip. So far 1143 bulls have been genotyped in Israel. Of these 912 were genotype by the original BeadChip, and 256 by the v2 BeadChip. Twenty-five bulls were genotyped by both BeadChips. The bulls were born between 1975 and 2009. Of these bulls, 995 have genetic evaluations for milk production traits, somatic cell score, female fertility, and milk production persistency based on progeny tests with reliabilities > 50%. DNA was extracted at the laboratory of the genetics unit of the Institute of Animal Sciences of the Agricultural Research Organization according to the protocol of Illumina Inc. Hybridization of the original BeadChip was performed at the Rapport Institute of Technion, and of the v2 BeadChip by GeneSeek Inc., Lincoln, NE. The 400 markers with the greatest effect on each trait, as estimated by restricted maximum likelihood methodology, were selected for determination of genomic evaluations. Genetic evaluations of 79 bulls of age 5 to 8 years based on genomics and parent average were compared to the evaluations of these same bulls based only the means of their parent evaluations, and to the current evaluations of these bulls based on progeny test. We found that inclusion of marker data in the genetic evaluations: 1) significantly improved the evaluations, 2) reduced bias, 3) but was not sufficient to dispense with the progeny test. Results from other, larger, populations demonstrate that reliabilities of 50-70% can be obtained if at least 5000 genotyped bulls are included in the analysis. However, no country has so far decided to illuminate progeny testing of young bulls. Based on the genomic evaluations of 132 bulls under the age of 5 years that do not as yet have progeny test results, we can recommend: 1) culling of bulls with negative genomic evaluations, and 2) immediate return to service of bulls with genomic evaluations equal to older bulls currently in general service.

לכל המבזקים....
office@milk.org.il פקס: 972-3-9564766 טל: 972-3-9564750 דרך החורש 4 , ת"ד 97, יהוד 5647003
מופעל באמצעות מעוף - מגוון אפקט