טיפים שימושיים

רשתות למחשבי-על

Pin
Send
Share
Send
Send


מחשוב מבוזר הוא דרך אחת לתרום לכמה פרויקטים מעניינים. כאשר המחשב שלך אינו פעיל, שתף את הכוח שלו עם פרויקט SETI, שמחפש תרבויות מחוץ לכדור הארץ. במקרה זה, המחשב שלך ינתח נתוני לוויין ומידע שהתקבל מטלסקופים.

מאמר זה יעזור לכם להצטרף לפרויקטים (כגון SETI) הכוללים מחשוב מבוזר. המאמר גם מציג בפניכם את BOINC, תוכנת מחשוב מבוזרת.

אתה צריך מחשב. אם כבר יש לך כניסה לסעיף מקורות וקישורים והתקן את תוכנת BOINC. אם אינכם מעוניינים בפרויקט SETI, למטה תוכלו למצוא רשימת פרויקטים אחרים.

אם הרבה כסף

בנפרד, אנו מציינים את קו המעבדים היקר אך הפורה ביותר בשקע Intel Xeon LGA1567.
המעבד העליון בסדרה זו הוא E7-8870 עם עשר ליבות 2.4 גיגה הרץ. מחירו 4616 דולר. עבור מעבדים כאלה, HP וסופרמיקרו משחררים! מעבד שמונה! שלדת שרת. שמונה מעבדי Xeon E7-8870 בן 2.4 ליבות 2.4 גיגה הרץ עם HyperThreading תומכים 8 * 10 * 2 = 160 חוטים, המוצג במנהל המשימות של Windows כמאה וששים גרפים של טעינת מעבד, מטריקס 10x16.

על מנת ששמונה מעבדים ישתלבו בתיק, הם לא יונחו מייד על לוח האם, אלא על לוחות נפרדים שנדבקים בלוח האם. בתמונה מוצגות ארבע לוחות אם עם מעבדים המותקנים בלוח האם (שניים על כל אחד). זהו פיתרון Supermicro. בפתרון של HP, לכל מעבד יש לוח משלו. עלות פיתרון של HP היא שניים עד שלושה מיליון, תלוי במספר המעבדים, הזיכרון ועוד. שלדת הסופרמיקרו עולה 10,000 דולר, וזה אטרקטיבי יותר. בנוסף, Supermicro יכולה להכניס ארבעה כרטיסי הרחבה של מעבד במוצרי PCI-Express x16 (אגב, עדיין יהיה מקום למתאם אינפיניבנד להרכיב אשכול כזה), אך רק שניים ב- HP. לפיכך, ליצירת מחשב-על, פלטפורמת שמונה מעבד מבית Supermicro מושכת יותר. בתמונה הבאה מהתערוכה מוצג מחשב העל השלם הכולל ארבעה לוחות GPU.

עם זאת, זה יקר מאוד.

רשתות תקשורת

היעילות של מחשב-על ביישומים רבים נקבעת במידה רבה על ידי פרופיל העבודה עם הזיכרון והרשת. פרופיל העבודה עם הזיכרון מתואר בדרך כלל על ידי לוקליזציה מרחבית-זמנית של שיחות - לפי גודל השיחות ופיזור הכתובות שלהם, והפרופיל של עבודה עם הרשת מתואר על ידי התפלגות הצמתים איתם מחליפים הודעות, שער החליפין וגדלי ההודעות.

ביצועיו של מחשב-על במשימות עם חילופי נתונים אינטנסיביים בין צמתים (בעיות דוגמנות, בעיות בגרפים ורשתות לא סדירות, חישובים באמצעות מטריצות דלילות) נקבעים בעיקר על ידי ביצועי הרשת, ולכן השימוש בפתרונות מסחריים קונבנציונליים (לדוגמה, Gigabit Ethernet) אינו יעיל ביותר. עם זאת, רשת אמיתית היא תמיד פיתרון פשרה, בפיתוח אשר נקבעים סדרי עדיפויות בין מחיר, ביצועים, צריכת אנרגיה ודרישות אחרות הסותרות במידה רבה: ניסיונות לשפר מאפיין אחד יכולים להביא להידרדרות של האחר.

רשת תקשורת מורכבת מצמתים שבכל אחד מהם מתאם רשת המחובר לנתב אחד או יותר, אשר בתורם מחוברים זה לזה על ידי ערוצי תקשורת (קישורים) במהירות גבוהה.

איור. 1. טופולוגיה 4D-טורוס (3x3x3x3)

מבנה הרשת, הקובע כיצד בדיוק קשורים צמתי המערכת, נקבעת על ידי טופולוגיית הרשת (לרוב סריג, טורוס או עץ עבה) ומערכת פרמטרים מבניים: מספר המדידות, מספר מפלסי העצים, מידות צדי הטורוס, מספר המתגים ברמות העץ, מספר צמתי הרשת יציאות בנתבים וכו '. איור 1 מציג דוגמה לטופולוגיה של טורוס ארבעה ממדים 3x3x3x3.

הארכיטקטורה של הנתב קובעת את המבנה והפונקציונליות של הבלוקים האחראים להעברת נתונים בין צמתים ברשת, כמו גם את המאפיינים הדרושים לפרוטוקולים של שכבות הערוץ, הרשת וההובלה, כולל אלגוריתמים לבקרת ניתוב, בוררות וזרם נתונים. הארכיטקטורה של מתאם הרשת קובעת את המבנה והפונקציונליות של הבלוקים האחראים לאינטראקציה בין המעבד, הזיכרון והרשת, בפרט, פעולות MPI נתמכות ברמה זו, RDMA (גישה ישירה לזיכרון ישיר מרחוק - גישה ישירה לזיכרון של צומת אחרת ללא השתתפות המעבד שלה), אישורי קבלה על ידי צומת אחר של המנה, טיפול במצבים חריגים, צבירת מנות.

כדי להעריך את הביצועים של רשת תקשורת, לרוב נעשה שימוש בשלושה מאפיינים: רוחב פס (כמות הנתונים המועברים ליחידת זמן), עיכוב תקשורתי (זמן העברת נתונים ברשת), קצב המסר (בדרך כלל, הם שוקלים בנפרד את קצב המסירה בעת שליחה, קבלה ושידור של מנות בין היחידות הפנימיות של הנתב).

לצורך השלמות, מאפיינים אלה נמדדים בסוגים שונים של תנועה, למשל כאשר צומת אחד שולח נתונים לכל האחרים, או להפך, כל הצמתים שולחים נתונים לאחד, או כאשר כל הצמתים שולחים נתונים ליעדים אקראיים. דרישות פונקציונליות מוטלות על רשתות מודרניות:

  • יישום אפקטיבי של ספריית שמם, כאפשרות לתמוך במודל התקשורת החד-כיווני, ו- GASNet, עליו מבוססת יישום של שפות PGAS רבות,
  • יישום יעיל של MPI (לרוב זה דורש תמיכה אפקטיבית במנגנון מאגרי הטבעות ואישורים עבור מנות שהתקבלו),
  • תמיכה אפקטיבית בפעולות קולקטיביות: שידור (שליחת אותם נתונים בו זמנית לצמתים רבים), צמצום (הפעלת פעולה בינארית, למשל תוספת, לסט הערכים שהתקבלו מצמתים שונים), חלוקת רכיבי מערך על מערך הצמתים (פיזור), הרכבת מערך של אלמנטים, ממוקם בצמתים שונים (לאסוף),
  • תמיכה אפקטיבית בפעולות סינכרון בין צומת (לפחות סנכרון מחסום), אינטראקציה יעילה עם רשת של מספר גדול של תהליכים בצומת והבטחת מסירת מנות אמינה.

חשוב גם תמיכה יעילה בעבודת המתאם בזיכרון של המארח ישירות ללא מעורבות מעבד.

רשתות זרות במהירות גבוהה

ניתן לחלק את כל רשתות התקשורת לשתי מחלקות: מסחריות ומותאמות אישית, שפותחו כחלק ממערכות מחשב וזמינות רק איתן. בין הרשתות המסחריות השוק מתחלק בין InfiniBand ו- Ethernet - ברשימת Top500 (יוני 2011) 42% מהמערכות משתמשות ב- InfiniBand ו- 45% משתמשים בג'יגאביט אתרנט. יחד עם זאת, אם InfiniBand ממוקדת בקטע של מערכות בעלות ביצועים גבוהים המיועדות למשימות מחשוב מורכבות עם מספר גדול של תקשורת, אז Ethernet תופסת באופן מסורתי נישה שבה חילופי נתונים בין צמתים אינה קריטית. במחשבי-על לרוב משמשת רשת ה- Ethernet, בשל עלותה וזמינותה הנמוכה, כרשת שירות עזר על מנת להפחית את ההפרעה בתנועת הבקרה ותעבורת המשימות.

רשת Inifiniband התמקדה בתחילה בתצורות עם הטופולוגיה של עץ השמן, אך הגרסאות האחרונות של מתגים ונתבים (המיוצרים בעיקר על ידי QLogic) תומכים בטופולוגיית טורוס רב-ממדית (באמצעות מנוע הניתוב Torus-2QoS), כמו גם טופולוגיה היברידית מטורוס התלת מימד. ועץ שמן. מחשב העל של Sandia RedSky, שהורכב בתחילת 2010 ועכשיו במקום ה -16 בטופ500, הוא אחד הפרויקטים הגדולים הראשונים עם רשת InfiniBand וטורולוגיה תלת מימדית לטופולוגיה (6x6x8). כמו כן, תשומת לב רבה מוקדשת כעת לתמיכה אפקטיבית בפעולות RDMA ובספריית שמם (בפרט Qlogic Shmem).

הפופולריות של InfiniBand נובעת מעלות נמוכה יחסית שלה, מערכת אקולוגית מפותחת של תוכנה ותמיכה יעילה עבור MPI. עם זאת, ל- InfiniBand החסרונות שלה: שיעור נמוך של מסירת הודעות (40 מיליון הודעות בשנייה בפתרונות האחרונים של מלאנוקס), יעילות הולכה נמוכה של מנות קצרות, עיכוב גדול יחסית (יותר מ -1.5 מיקרומטר להעברות צומת לצומת ו 0.1- נוספים) 0.5 מיקרומטר לכל צומת מעבר), תמיכה חלשה לטופולוגיה הטורואידלית. באופן כללי ניתן לטעון כי InfiniBand הוא מוצר למשתמש ההמוני, ובמהלך פיתוחו נעשתה פשרה בין יעילות ורבגוניות.

אנו יכולים לציין גם את הרשת Extoll, שמוכנה להשקה בשוק - פיתוח אוניברסיטת היידלברג בראשותו של פרופסור אולריך ברוינינג. הדגש העיקרי בפיתוח רשת זו הוא צמצום העיכובים והגדלת קצב המסירה בתקשורת חד כיוונית. מתוכנן כי ל- Extoll תהיה טופולוגיית טורוס תלת מימדית ותשתמש בקישורים אופטיים עם רוחב פס של 10 ג'יגה-בתים / שניה לנתיב (ערוץ העברת נתונים סדרתי בתוך הקישור) ורוחב של 12 נתיבים לקישור. כעת ישנם אבות טיפוס של רשת Extoll ב- FPGA: R1 - מבוסס על Virtex4, R2 Ventoux - מתווה דו-צומתי המבוסס על Virtex6. רוחב פס חד כיווני לקישור הוא 600 מגהבייט / שניות (תמורת R1). יתמכו גם שני ממשקים (HyperTransport 3.0 ו- PCI Express gen3) עם מעבד, שיאפשרו שילוב רשת זו בפלטפורמות אינטל ו- AMD. Extoll תומכת במספר דרכים לארגון רשומות חד כיווניות, MMU משלה (יחידת ניהול זיכרון, בלוק של תרגום כתובות וירטואליות לכתובות פיזיות) ופעולות אטומיות.

בניגוד לרשתות מסחריות, רשתות בהתאמה אישית תופסת נתח שוק קטן בהרבה, עם זאת הן משמשות במחשבי העל החזקים ביותר של קריי, יבמ, SGI, פוג'יטסו, NEC ובול. בעת תכנון רשתות בהתאמה אישית, למפתחים יש חופש רב יותר ומנסים להשתמש בגישות מתקדמות יותר בגלל החשיבות הנמוכה יותר של האטרקטיביות בשוק של המוצר הסופי, ופותרים בראש ובראשונה את הבעיה של השגת ביצועים מירביים במחלקה מסוימת של משימות.

מחשב העל של מחשב K משתמש ברשת Tofu (TOrus FUsion) קניינית, שהיא טורוס תלת מימד הניתן להרחבה אשר הצמתים שלהם מכילים קבוצות של 12 צמתים (קבוצות של צמתים מחוברים על ידי 12 רשתות עם טורוס תלת מימדי, ולכל צומת מקבוצה זו יש פלט משלה רשת טורוס תלת מימדית). הצמתים בתוך כל קבוצה מחוברים זה לזה על ידי טורוס תלת ממדי עם צלעות 2x3x4 ללא קישורים כפולים, וזה שווה ערך לטורוס דו-מימדי עם צדדים 3x4 (כך נקבל טורוס 5D עם שני ממדים קבועים). לפיכך, לצומת הרשת של טופו יש 10 קישורים עם תפוקה חד כיוונית של 40 ג'יגה-בתים / שניות כל אחד. סנכרון מחסומים של צמתים וצמצום (מספר שלם ונקודה צפה) נתמכים בחומרה.

המטרות העיקריות בפיתוח מחשב העל Tianhe-1A היו להשיג יעילות אנרגטית גבוהה, פיתוח מעבד ורשת משלהם העולים על InfiniBand QDR. מחשב העל מורכב מ- 7168 צמתי מחשוב המחוברים על ידי רשת ה- Arch מעיצוב משלו עם טופולוגיית העצים העבה. הרשת בנויה מנתבים של 16 יציאות, רוחב פס קישור לכיוון - 8 ג'יגה-בתים / שניות, עיכוב - 1.57 מיקרו-שניות. פעולות RDMA נתמכו ופעולות קולקטיביות מותאמות.

נציגים קלאסיים של מערכות המשתמשות בטופולוגיה טורואידית לשילוב צמתים חישוביים הם מערכות לסדרת ה- Blue Blue של יבמ, שבשני הדורות הראשונים שבהם - Blue Gene / L (2004) ו- Blue Gene / P (2007) - השתמשו בטופולוגיית התור התלת-ממדי. לרשת ב- Blue Gene / P יש קישורים חלשים יחסית עם רוחב פס חד צדדי של 0.425 GB / s, שהוא סדר גודל הנמוך מרוחב הפס של קישור ה- InfiniBand QDR העכשווי שלה, עם זאת, תמיכה מבוססת חומרה לסנכרון חסמים ופעולות קולקטיביות (ברשתות נפרדות דמויות עץ) מאפשרת מדרגיות טובה במערכת יישומים אמיתיים. בנוסף, כל הממשקים ויחידות הניתוב משולבים במעבד המיקרו-BPC (Blue Gene / P Chip), מה שמקטין משמעותית את עיכובי העברת ההודעות. לרשת התקשורת של הדור הבא Blue Gene / Q יש טופולוגיית 5D-tor, ובניגוד לקודמותיה, אין לה רשתות נפרדות לסנכרון חסמים ופעולות קולקטיביות. שבב הכחול ג'ין / Q הפך לראשונה לרב-ליבת-רב-חוטים - ארבעה חוטי חומרה ללינה עם 16 ליבות, המאפשרים היחלשות דרישות הרשת ומבטיח סובלנות לעיכוב. תפוקת הקישור הוגדלה ל -2 GB / s, אך עדיין נותרה קטנה בהשוואה ל- Cray Gemini או Extoll. התפוקה הנמוכה במערכות אלו מפולסת לפי המימד הגדול של טורוס (מספר גדול של קישורים) וכתוצאה מכך, בקוטר הקטן של הרשת (קטנה משמעותית מזו של רשתות עם טופולוגיית טורוס תלת ממדית עם אותו מספר צמתים). מקורות זמינים מדווחים על יצירתם של שני מחשבי-על טרנזיטפלופ כחול ג'ין / Q: סקויה עם ביצועים של 20 PFLOPS ומירה - 10 PFLOPS. אנו יכולים להסיק כי Blue Gene / Q מתמקד במשימות שישתמשו בעשרות ומאות אלפי צמתי מחשוב עם תעבורת רשת מסוג "הכל לכולם".

תומך נוסף בגישה לבניית רשתות תקשורת עם טופולוגיה טורואידית הוא Cray, שממשיך להשתמש בטופולוגיית ה- tor 3D, תוך הגדלת התפוקה ומספר הקישורים המחברים בין צמתים שכנים. הדור הנוכחי של הרשת טורואידית Cray הוא רשת Cray Gemini. נתב מזל תאומים אחד מתאים לשני נתבים מהדור הקודם של SeaStar2 +, כלומר למעשה לשני צמתים ברשת, ולכן אצל תאומים במקום 6 קישורים משתמשים 10 לחיבור לצמתים שכנים (2 משמשים לחיבור שני מתאמים אחד לשני).

הרכיבים (מתאמי רשת, מתגים, נתבים) של רשת למחשב-על, בניגוד למעבדים, הם לעתים קרובות יקרים יותר, והגישה אליהם מוגבלת יותר. לדוגמה, כעת המתגים לרשת InfiniBand, שהיא הרשת המסחרית העיקרית עבור מחשבי-על, מיוצרים על ידי שתי חברות בלבד, שתיהן נשלטות על ידי ארצות הברית. המשמעות היא שבהיעדר התפתחויות משלהם בתחום הרשתות המהירות, ניתן לשלוט בקלות על יצירת מחשבי-על מודרניים בכל מדינה פרט לארצות הברית, סין או יפן.

רשתות ביתיות

פיתוח רשתות תקשורת לשימוש במחשבי על מתבצע על ידי מספר ארגונים פנים: ה- RFNC VNIIEF (יש מעט מאוד מידע על התפתחויות אלה במקורות פתוחים), המכון למערכות תוכנה של האקדמיה הרוסית למדעים ו- RSK SKIF, IPM RAS ומכון המחקר Kvant (MVS-Express רשת) ").

רשת התקשורת התלת ממדית עבור מחשב העל הרוסי-איטלקי SKIF-Aurora בנויה לחלוטין באמצעות Altera Stratix IV FPGA, שמסבירה את רוחב הפס הקטן למדי לקישור - 1.25 GB / s (משאבי FPGA מוגבלים מאוד).

ברשת MVS-Express משתמשים ב- PCI Express 2.0 כדי לשלב את צמתי המחשוב, והצמתים מחוברים דרך מתגי 24 יציאות. לרשת טופולוגיה קרובה לעץ השמן. למתאם הרשת בצומת המחשוב יש יציאה אחת ברוחב של 4 נתיבים, כתוצאה מכך תפוקת השיא החד כיוונית לקישור היא 20 ג'יגה ביט / שניות מבלי לקחת בחשבון את התקורה קידוד. היתרון בשימוש ב- PCI Express ב- MVS-Express הוא תמיכה יעילה של זיכרון משותף עם אפשרות לתקשורת חד כיוונית. כתוצאה מכך, הרשת נוחה ליישום ספריית שמם ושפות PGAS (UPC, CAF).

בתמיכת משרד התעשייה והמסחר של הפדרציה הרוסית, NICEVT OJSC עובד על פיתוח רשת התקשורת Angara עם טופולוגיית 4D-tor, שיכולה להפוך לבסיס ליצירת טכנולוגיות ביתיות לפיתוח מחשבי-על.

רשת "אנגרה"

היעדים העיקריים של פיתוח רשת אנגארה:

  • תמיכה יעילה לתקשורת חד כיוונית (put / get) ושפות PGAS (כאמצעי עיקרי לתכנות מקבילה),
  • תמיכה יעילה ב- MPI
  • שחרור של גביש משלו (כדי להשיג שיעורי העברת נתונים גבוהים ועיכובים נמוכים),
  • העברת מנות בטוחה כישלון-אדפטיבית,
  • עבודה יעילה עם מעבדים ומערכות שבבים מודרניות.

בשלב הראשון של פיתוח רשת זו (2006) בוצעה הדמיה של אפשרויות רשת שונות וההחלטות העיקריות התקבלו על הטופולוגיה, ארכיטקטורת הנתבים, אלגוריתמים לניתוב ובוררות. בנוסף לטופולוגיה הטורואידית, נחשבו רשתות קיילי וה"עץ העבה ". הטורוס הארבעה ממדי נבחר על ידי ניתוב פשוט יותר, יכולת מדרגיות טובה וקישוריות גבוהה בהשוואה לטורי קטן יותר. דוגמנות רשת אפשרה ללמוד בפירוט את ההשפעה של פרמטרים שונים של ארכיטקטורת הרשת על מאפייני הביצועים העיקריים, להבין את הדפוסים לתעבורת המשימות עם גישה לא סדירה אינטנסיבית לזיכרון. כתוצאה מכך, נבחרו גדלי מאגר מיטביים, מספר הערוצים הווירטואליים וניתחו צווארי בקבוק פוטנציאליים.

בשנת 2008 הופיע אב-הטיפוס הראשון של נתב FPGA - מתווה רשת של שישה צמתים ב- Virtex4 המחובר לטורוס 2x3, עליו פותחה הפונקציונליות הבסיסית של הנתב, עובדה העברת נתונים סובלנית לתקלות, הנהג וספרייה ברמה נמוכה נכתבו וניגולים, ספריות שמם הוצאו והועברו MPI כעת השיקה פריסת דור שלישי, המורכבת מתשעה צמתים המחוברים בטורוס דו-ממדי 3x3. Собран стенд с двумя узлами для тестирования новых разъемов и каналов передачи данных, предполагаемых к использованию с будущими кристаллами маршрутизатора ВКС. При разработке принципов работы сети ряд деталей был позаимствован из работ и , а также в том или ином виде из архитектур IBM Blue Gene и Cray SeaStar.

Сеть «Ангара» имеет топологию 4D-тор. Поддерживается детерминированная маршрутизация, сохраняющая порядок передачи пакетов и предотвращающая появление дедлоков (взаимных блокировок), а также адаптивная маршрутизация, позволяющая одновременно использовать множество путей между узлами и обходить перегруженные и вышедшие из строя участки сети. תשומת לב מיוחדת הוקדשה לתמיכה בפעולות קולקטיביות (שידור והפחתה) המיושמות באמצעות רשת משנה וירטואלית עם הטופולוגיה של עץ שהונחה על טורוס רב ממדי. הרשת ברמת החומרה תומכת בשני סוגים של פעולות כתיבה, קריאה ופיתוח אטומי מרחוק (תוספת ו- OR בלעדי). סכמת ביצוע הקריאה מרחוק (שליחת בקשה וקבלת תגובה) מוצגת באיור. 2 (הקלטה מרחוק ופעולות אטומיות מבוצעות באופן דומה). בבלוק נפרד, ההיגיון מיושם בכדי לצבור הודעות המתקבלות מהרשת על מנת להגדיל את חלקם של נתונים שימושיים בכל עסקה בעת העברת דרך ממשק עם מארח (מארח הוא גשר זיכרון מעבד-גשר).

איור. 2. תוכנית קריאה מרחוק ברשת אנגרה

בשכבת קישור הנתונים נתמכת שידור מנות בטוח. ישנו גם מנגנון לעקיפת ערוצי תקשורת וצמתים כושלים על ידי בניית מחדש טבלאות ניתוב. כדי לבצע פעולות שירות שונות (בפרט, להגדיר / לבנות מחדש טבלאות ניתוב) ולבצע כמה חישובים, נעשה שימוש במעבד שירות. ממשק המארח משתמש ב- PCI Express.

איור. 3. מבנה צומת המחשוב עם מתאם / נתב רשת "אנגרה"

הבלוקים העיקריים של הנתב:

  • ממשק עם מערכת המארחים, אחראי על קבלת ושליחת מנות בממשק המארח,
  • יחידת הזרקה ופליטה שיוצרת מנות שיישלחו לרשת ומנתחת את כותרות המנות המגיעות מהרשת,
  • יחידת עיבוד בקשות המעבדת מנות שדורשות מידע מהזיכרון של המערכת המארחת (לדוגמה, קריאות או פעולות אטומיות),
  • יחידת רשת פעולות קולקטיבית המעבדת מנות הקשורות לפעילות קולקטיבית, בפרט, ביצוע פעולות צמצום, יצירת מנות לבקשת שידור,
  • יחידת פעולות שירות שמעבדת חבילות שהולכות ומעבדי מעבד השירות,
  • מתג המחבר כניסות מערוצים וירטואליים שונים וכניסות מזרקים עם יציאות לכיוונים ומפלטים שונים,
  • ערוצי תקשורת להעברה וקבלת נתונים בכיוון מסוים,
  • יחידת העברת נתונים לשליחת מנות לכיוון נתון, ויחידת קבלה וניתוב לקבלת מנות ולהחלטה על גורלם העתידי.

האינטראקציה המארחת (הקוד המבוצע במעבד המרכזי) עם הנתב מתבצעת על ידי כתיבה לכתובות הזיכרון הממופה לכתובות של אזורי המשאבים של הנתב (קלט / פלט ממופה זיכרון). זה מאפשר ליישום לקיים אינטראקציה עם הנתב ללא השתתפות של הגרעין, מה שמקטין את התקורה של שליחת מנות, מכיוון שהמעבר להקשר של הגרעין והחזרה לוקח יותר ממאה מחזורי שעון. לשליחת מנות משתמשים באחד מאזורי הזיכרון שנחשב למאגר צלצולים. יש גם אזור נפרד לביצוע פעולות ללא העתקת זיכרון זיכרון (נתונים נקראים מהזיכרון ונכתבים על ידי מתאם רשת התקשורת דרך פעולות DMA) ואזור עם רישומי בקרה. הגישה למשאבים מסוימים של הנתב נשלטת על ידי המודול הגרעיני.

כדי להשיג יעילות רבה יותר הוחלט כי יש לבצע רק משימה חישובית אחת בצומת אחד, הדבר ביטל את התקורה הקשורה בשימוש בזיכרון הווירטואלי, נמנע מהפרעה במשימות, פשט את הארכיטקטורה של הנתב עקב היעדר MMU מלא ונמנע מכל עיכוב עבודתו בתקשורת, כמו גם לפשט את מודל אבטחת הרשת, ומבטל ממנו את אבטחת התהליכים של משימות שונות בצומת אחד. פיתרון זה לא השפיע על הפונקציונליות של הרשת כמיועד בעיקר למשימות גדולות (בניגוד ל- InfiniBand, רשת אוניברסלית למשימות בגדלים שונים). החלטה דומה התקבלה ב- IBM Blue Gene, שם מוצגת הגבלה על הייחודיות של המשימה עבור המדור.

ברמת החומרה נתמכת עבודה סימולטנית עם הנתב של חוטים / תהליכים רבים של משימה אחת - היא מיושמת בצורה של מספר ערוצי הזרקה הזמינים לשימוש על ידי תהליכים דרך מספר מאגרי טבעת להקלטת מנות. המספר והגודל של מאגרים אלה יכולים להשתנות באופן דינמי.

מצב התכנות העיקרי של רשת אנגארה הוא השימוש המשותף ב- MPI, OpenMP ו- Shmem, כמו גם GASNet ו- UPC.

לאחר סיום האימות והטיפוס של הרשת, מתוכנן לשחרר שבב VLSI. אצווה VLSI של אב-טיפוס תוכנן לניפוי של פתרונות טכנולוגיים בסיסיים, תהליך טכנולוגי ואימות ניסיוני של תוצאות הסימולציה. אב-הטיפוס יכיל את כל הפונקציונליות הבסיסית, יעבוד עם ממשק PCI Express gen2 x16 וקישורים עם תפוקה של 75 ג'יגה-בתים / שניות.

הוא מתוכנן לקדם את רשת אנגארה לשוק בשתי גרסאות: כרשת מסחרית נפרדת בצורת כרטיסי PCI Express למערכות אשכולות עם מעבדים סטנדרטיים וערכות שבבים, וכחלק ממערכת להב בעל ארבע שקעים המבוססת על מעבדי AMD הנמצאים בפיתוח ב- NICEVT.

Pin
Send
Share
Send
Send