פריצת דרך של מיקרוסופט תקרר ישירות את הסיליקון בשבבי AI

AI הוא הדבר החם הבא – תרתי משמע.

השבבים שמרכזי הנתונים משתמשים בהם להריץ את פריצות הדרך האחרונות ב-AI מייצרים הרבה יותר חום מדורות קודמים של סיליקון. כל מי שהפלאפון או הלפטופ שלו התחמם מדי, יודע שמכשירים אלקטרוניים לא אוהבים חום. לאור הביקוש הגובר ל-AI ועיצובים חדשים של שבבים, טכנולוגיות הקירור הנוכחיות יגבילו את התקדמות הטכנולוגיה בעוד כמה שנים.

כדי להתמודד עם הבעיה, מיקרוסופט בחנה בהצלחה מערכת קירור חדשה שקיררה את המערכת עד פי 3 טוב יותר מצלחות קירור  – טכנולוגיית הקירור הנפוצה כיום. המערכת עושה שימוש במיקרופלואידיקה – גישה שמביאה נוזל קירור ישירות לתוך הסיליקון, שם נמצא החום. תעלות זעירות נחרצות ישירות בגב שבב הסיליקון, ויוצרות חריצים שמאפשרים לנוזל הקירור לזרום ישירות על השבב ולפנות את החום בצורה יעילה יותר. הצוות השתמש גם ב-AI כדי לזהות את "טביעות החום" הייחודיות על השבב ולכוון את הקירור בדיוק רב יותר.

חוקרים אומרים שמיקרופלואידיקה יכולה לשפר את יעילות ועמידות השבבים בדור הבא של שבבי AI. רוב המעבדים הגרפים הפועלים היום במרכזי נתונים, מקוררים באמצעות לוחות קירור המופרדים ממקור החום על ידי מספר שכבות המגבילות את כמות החום שהם יכולים לקרר.

ככל שכל דור חדש של שבבי AI הופך חזק יותר, הם מייצרים יותר חום. בתוך חמש שנים בלבד "אם אתה נשען על טכנולוגיה מסורתית של צלחות קירור, תיתקע" אמר סשי מג'טי (Sashi Majety), מנהל תוכנית טכנית בכיר לפעולות וחדשנות בענן במיקרוסופט.

החודש, הכריזה מיקרוסופט כי פיתחה בהצלחה מערכת קירור מיקרופלואידית תוך שבבית (בתוך השבב), היכולה לקרר ביעילות שרת המריץ שירותי ליבה עבור פגישת TEAMS מדומה.

"מיקרופלוידיקה תאפשר עיצובים בעלי צפיפות הספק גבוהה יותר שיאפשרו יותר  פיצ'רים החשובים ללקוחות וביצועים טובים יותר בשטח קטן יותר". אמרה ג'ודי פריסט, סגנית נשיאה בכירה ומנהלת טכנולוגית ראשית (CTO) של תחום תפעול הענן וחדשנות במיקרוסופט. "אך היינו צריכים להוכיח שהטכנולוגיה והעיצוב עובדים, ולאחר מכן הדבר הבא שרציתי לבדוק היה אמינות" הוסיפה פריסט.

צורת החריצים המדמה נימים של צמח

ע"פ בדיקות במעבדת החברה, מיקרופלואידיקה הראתה ביצועים הטובים פי 3 מצלחות קירור, בהתאם לעומסי העבודה והקונפיגורציות המעורבות. המיקרופלואידיקה גם הפחיתה את העלייה המרבית בטמפרטורת הסיליקון בתוך המעבד הגרפי ב-65 אחוזים, אם כי נתון זה עלול להשתנות בהתאם לסוג השבב. הצוות צופה שטכנולוגיית הקירור המתקדמת תשפר גם את יעילות השימוש באנרגיה – מדד מרכזי למדידת היעילות האנרגטית של מרכז נתונים, ותפחית את עלויות התפעול.

מיקרופלואידיקה אינה קונספט חדש, אך הפיכתה למעשית נחשב לאתגר בתעשיה. "חשיבה מערכתית היא קריטית בפיתוח טכנולוגיה כמו מיקרופלואידיקה. צריך להבין אינטרקציות מערכתיות בין סיליקון, נוזל הקירור, השרת ומרכז הנתונים כדי להפיק את המיטב" אמר חוסאם אליסה (Husam Alissa), מנהל תחום טכנולוגיות מערכות בתפעול הענן וחדשנות במיקרוסופט.

חריצת התעלות בשבב בצורה נכונה היא הליך קשה. ממדי המיקרו-תעלות דומים לעובי שערה אנושית, כלומר אין מקום לטעויות. במסגרת מאמצי הפיתוח, מיקרוסופט שיתפה פעולה עם הסטארט-אפ השווייצרי Corintis בכדי להשתמש בבינה מלאכותית לסייע באופטימיזציה של עיצוב בהשראה ביולוגית, המקרר את "הנקודות החמות" בשבבים ביעילות רבה יותר מאשר תעלות ישרות – שגם הן נבדקו. העיצוב הביולוגי מדמה ורידים של עלה או כנף של פרפר, שכן הטבע הוכיח שהוא יודע למצוא את הדרכים היעילות ביותר להפצת משאבים נדרשים ממקום למקום.

מיקרופלואידיקה דורשת יותר מאשר עיצוב תעלות חדשני – מדובר באתגר הנדסי מורכב.

יש צורך להבטיח שהתעלות עמוקות מספיק כדי לאפשר זרימה מספקת של נוזל קירור מבלי להיסתם, אך לא עמוקות מדי, מה שעלול להחליש את הסיליקון עד כדי סיכון לשבירה. הצוות ייצר ארבעה דגמי עיצוב שונים בשנה האחרונה בלבד.

מיקרופלואידיקה דרשה גם עיצוב מארז אטום לדליפות עבור השבב, מציאת נוסחת קירור מיטבית, בדיקת שיטות חריצה שונות ופיתוח תהליך שלב-אחר-שלב להוספת החריצה לתהליך ייצור השבבים.

הפריצה הזו היא רק דוגמה אחת לאופן שבו מיקרוסופט משקיעה ומחדשת תשתיות כדי לעמוד בביקוש לשירותי ויכולות AI . לדוגמה, החברה מתכננת להוציא מעל 30 מיליארד דולר בהשקעות הון ברבעון הנוכחי.
ההשקעות הללו כוללות גם פיתוח של משפחת השבבים Cobalt ו-Maia, שפותחו במיוחד כדי להריץ עומסי עבודה של מיקרוסופט ולקוחותיה ביעילות גבוהה יותר. מאז שמיקרוסופט פרסה את שבב Cobalt 100, לדוגמה, החברה ולקוחותיה נהנים מעוצמת מחשוב חסכונית באנרגיה, יכולת הרחבה וביצועים משופרים.

השבבים הם רק חלק מהפאזל, שכן הסיליקון פועל בתוך מערכת מורכבת של לוחות, מתלים ושרתים במרכז הנתונים. הגישה המערכתית של מיקרוסופט משמעותה כיוונון של כל רכיב בשרשרת הזו כדי שיפעלו יחד וימקסמו ביצועים ויעילות. חלק חשוב בכך הוא פיתוח טכניקות קירור מהדור הבא כמו מיקרופלואידיקה.

בשלב הבא, מיקרוסופט תמשיך לבחון כיצד ניתן לשלב קירור מיקרופלואידי בדורות הבאים של שבבים מתוצרתה. בנוסף, תמשיך לעבוד עם שותפי ייצור וסיליקון כדי להכניס את טכנולוגיית המיקרופלואידיקה לייצור במרכזי הנתונים שלה, כך נמסר מהחברה.

"חומרה היא הבסיס לשירותים שלנו," אמר ג'ים קליווין, עמית טכני בניהול הליבה של Microsoft 365. לכולנו יש עניין בבסיס הזה – עד כמה הוא אמין, עד כמה הוא חסכוני, עד כמה הוא מהיר, עד כמה ההתנהגות שלו עקבית, ועד כמה הוא יציב, רק כדי לציין כמה דוגמאות, מיקרופלואידיקה משפרת כל אחד מההיבטים האלו: עלות, אמינות, מהירות, עקביות התנהגות ויציבות."

יתרונות המיקרופלואידיקה

שיחת Teams פשוטה ממחישה את היתרונות שקירור מיקרופלואידי יכול להציע. Teams אינו שירות יחיד, אלא אוסף של כ-300 שירותים שונים שפועלים יחד בהרמוניה. אחד מחבר לקוח לפגישה, אחר מארח את הפגישה, אחר שומר את הצ'אט, אחר ממזג את זרמי האודיו כך שכאשר כמה אנשים מדברים – כולם נשמעים, אחר מקליט, ואחר מתמלל.

"לכל שירות יש מאפיינים שונים אשר מעמיסים באופן שונה חלקים שונים בשרת" אמר קליווין. "ככל שהשרת מנוצל יותר, כך הוא מייצר יותר חום – וזה הגיוני."

לדוגמה, רוב שיחות Teams מתחילות בשעה עגולה או במחציתה. בקר השיחות (call controller) נעשה עסוק במיוחד כחמש דקות לפני ועד שלוש דקות אחרי הזמנים הללו ואינו עסוק במיוחד בשאר הזמן. יש שתי דרכים להתמודד עם שיאי ביקוש – להתקין הרבה יכולת קיבול יקרה שאינה מנוצלת רוב הזמן, או להריץ את השרתים בעומס גבוה יותר. מכיוון ש- Overclocking מחמם את השבבים עוד יותר, לא ניתן להשתמש בו בכל מצב, מחשש לנזק ושחיקת השבבים.

"בכל פעם שיש לנו עומסי עבודה חריגים, אנו רוצים להיות מסוגלים להריץ את השרתים בעומס גבוה יותר. מיקרופלואידיקה תאפשר לנו לעשות זאת בלי לדאוג שהשבב יימס, כי היא מקררת את השבב בצורה יעילה יותר," אמר קליווין. "יש יתרונות בעלות, באמינות ובמהירות."

כיצד קירור משתלב בתמונה הגדולה

מיקרופלואידיקה היא חלק מיוזמה רחבה יותר של מיקרוסופט לקידום טכניקות קירור מהדור הבא ולייעול כל רכיב בענן. באופן מסורתי, מרכזי נתונים קוּררו באמצעות אוויר שננשף על ידי מאווררים גדולים, אך נוזלים מוליכים חום ביעילות רבה יותר מאוויר.

צורה אחת של קירור נוזלי שמיקרוסופט כבר פרסה במרכזי הנתונים שלה היא צלחות קירור. הצלחות ממוקמות מעל השבבים, כאשר נוזל קר נכנס, מסתובב בתעלות בתוך הצלחות כדי לקלוט חום מהשבבים תחתיה, והנוזל החם יוצא החוצה ופולט את החום מהמערכת.

השבבים נארזים בשכבות של חומרים המסייעים לפזר את החום מהאזורים החמים ולהגן עליהם. אך חומרים אלו גם פועלים כמו שמיכות – הם מגבילים את הביצועים של צלחות הקירור בכך שהם שומרים את החום בפנים ומונעים מהקור להגיע לשבב. דורות עתידיים של שבבים, שיתאימו במיוחד ל-AI  צפויים להיות חזקים אף יותר – ולהתחמם מדי עבור קירור באמצעות צלחות קירור.

קירור שבבים ישירות דרך תעלות מיקרופלואידיות הוא יעיל בהרבה – לא רק בפינוי החום אלא גם בתפעול המערכת כולה. כאשר כל שכבות הבידוד מוסרות והנוזל המקרר נוגע ישירות בסיליקון החם, אין צורך שהנוזל יהיה קר במיוחד כדי לבצע את עבודתו. כך ניתן לחסוך באנרגיה לקירור הנוזל, תוך ביצועים טובים יותר מצלחות הקירור הקיימות. טכנולוגיית המיקרופלואידיקה גם מאפשרת שימוש איכותי יותר בחום המופק בהליך.

מיקרופלואידיקה היא חלק ממאמץ רחב יותר של מיקרוסופט לאופטימיזציה של תפעול מרכזי הנתונים באמצעות תוכנה ושיטות נוספות. "אם קירור מיקרופלואידי יוכל להשתמש בפחות חשמל לקירור מרכזי הנתונים, זה יפחית את העומס על רשתות החשמל בקהילות הסמוכות," אמר ריקרדו ביאנצ'יני (Ricardo Bianchini), עמית טכני וסגן נשיא בכיר ב- Azure, המתמחה ביעילות מחשוב.

החום גם מגביל את עיצוב מרכזי הנתונים. אחד היתרונות של מרכז נתונים עבור מחשב הוא שהשרתים ממוקמים פיזית קרוב זה לזה. המרחק מאט את התקשורת בין השרתים – תופעה שנקראת השהיה. אבל כיום ניתן לצופף את השרתים רק עד גבול מסוים לפני שהחום הופך לבעיה. מיקרופלואידיקה תאפשר למרכזי הנתונים להגדיל את צפיפות השרתים. המשמעות היא שמרכזי הנתונים יוכלו להגדיל את כוח המחשוב שלהם מבלי שיהיה צורך להקים מבנים נוספים, כך נמסר מהחברה.

העתיד של חדשנות בשבבים

למיקרופלואידיקה יש גם פוטנציאל לפתוח את הדלת לארכיטקטורות שבבים חדשות לחלוטין, כמו שבבים תלת-ממדיים. בדיוק כפי שצפיפות שרתים מפחיתה השהיה, ערימת שבבים מפחיתה אותה אף יותר. סוג כזה של ארכיטקטורה תלת-ממדית הוא אתגר לבנייה בגלל כמות החום שנוצר.

עם זאת, מיקרופלואידיקה מקרבת את הנוזל המקרר קרוב מאוד למקום בו נצרכת האנרגיה, כך ש"ייתכן שנזרים נוזל דרך השבב", כפי שקורה בעיצובים תלת-ממדיים, אמר ביאנצ'יני. הדבר ידרוש עיצוב מיקרופלואידיקה שונה, המשתמש בפינים גליליים בין ערמת השבבים, בדומה לעמודים בחניון רב-קומות, כאשר הנוזל זורם סביבם.

בכל פעם שאפשר לעשות דברים בצורה יעילה יותר ולפשט תהליכים, נפתחת ההזדמנות לחדשנות בה נוכל לבחון ארכיטקטורות שבבים חדשות," אמרה פריסט.

הסרת מגבלת החום בשבבים יכולה גם לאפשר להכניס יותר מהם למדף במרכז הנתונים או יותר ליבות בשבב, מה שישפר את המהירות ויאפשר מרכזי נתונים קטנים אך חזקים יותר.

על ידי הדגמת האופן בו טכניקות קירור חדשות כמו מיקרופלואידיקה יכולות לעבוד, מיקרוסופט מקווה לסלול את הדרך לשבבים מהדור הבא שיהיו יעילים ועמידים יותר בתעשייה כולה, כך נמסר מהחברה.

"אנחנו רוצים שמיקרופלואידיקה תהפוך למשהו שכולם עושים, לא רק אנחנו," אמר קליווין. "ככל שיותר אנשים יאמצו זאת, כך הטכנולוגיה תתפתח מהר יותר, וזה יהיה טוב יותר עבורנו, עבור הלקוחות שלנו, ועבור כולם."

למדו עוד ב: Microfluidics cooling: Cooling at the micro level for Microsoft’s datacenters