15 ציוני דרך שעיצבו את חזון ה-AI של מיקרוסופט

מאת אליוט סמית'

התחושה היא שהבינה המלאכותית (AI) פרצה לתודעה רק בשנים האחרונות כטכנולוגיה מגובשת, אשר מוכנה לשנות את האופן בו אנו מקיימים אינטראקציה עם העולם, אבל המציאות היא שפיתוח ה-AI הוא תוצאה של עשרות שנות עבודה. ההתקדמות החלה בתחומים כמו למידת מכונה ועיבוד שפה טבעית שהניחו את היסודות והתקדמויות רבות עוד צפויות להגיע.

כנראה שביל גייטס לא חשב במפורש על AI ביומו הראשון במשרד בשנת 1975, אבל אין ספק שהפריצות הטכנולוגיות והחדשנות שמיקרוסופט הובילה ב-50 השנים האחרונות היו צעדים קריטיים בדרך לעידן ה-AI של ימינו.

החל מהשקת מערכת ההפעלה הראשונה ב-1985 ועד למכתב ה-"Tidal Wave" של גייטס עשור לאחר מכן, שחזה את עוצמת האינטרנט, כוחה של החברה טמון תמיד ביכולתה לקבל שינויים ולשאוף אל העתיד. זה בא לידי ביטוי גם במאמרים פורצי דרך שנכתבו על ידי Microsoft Research בנושאי Bayesian Networks ו-Z3 theorem Prover, אשר סללו את הדרך להתפתחויות עתידיות בתחום ה-AI.

ככל שה-AI הופך לחלק בלתי נפרד מחיי היום-יום, בואו נבחן כיצד אבני דרך מרכזיות של מיקרוסופט סייעו בהנחת היסודות למצב בו אנו נמצאים כיום, וכיצד החברה מתכננת לפתח את הפלטפורמה, הכלים והתשתית המהימנים ביותר עבור עתיד ה-AI.

מחשב העל של Azure AI

תשתית מחשוב-על חסרת התקדים ב-Azure מאיצה פריצות דרך של OpenAI

בשנת 2020, מיקרוסופט הציגה מחשב-על חדש שאוחסן ב-Azure עבור OpenAI, תוך ביסוס תשתית חדשה לאימון מודלי AI גדולים וצעד ראשון בהפיכתם לזמינים כפלטפורמה. בזמן השקתו, בהשוואה למכונות אחרות המופיעות ב-TOP500 supercomputers  של מחשבי העל בעולם, מחשב העל של מיקרוסופט דורג בחמישייה הראשונה. בשנים הבאות, מיקרוסופט הרחיבה את התשתית הזו עם מחשבי על AI בקנה מידה חסר תקדים עבור התקדמות משמעותית בביצועי יישומים לאימון והסקת AI.

השותפות עם OpenAI נוצרה על בסיס ערכים משותפים ודחף לקדם באחריות את חוד החנית של AI. יחד, שתי החברות בנו תשתית מחשוב-על חסרת תקדים ב-Azure כדי להאיץ את פריצות הדרך של OpenAI, ובאמצעות שיתוף הפעולה הזה הן הצליחו להבין טוב יותר לא רק איך להרכיב את פלטפורמת ה-AI הטובה בעולם, אלא חשוב מכך, איך להעביר את יתרונותיה ללקוחות ולעולם.

GitHub Copilot

פותח את הדלת לדרך חדשה לקידוד עם AI

רכישת GitHub על ידי מיקרוסופט הובילה בסופו של דבר ליצירת GitHub Copilot בשנת 2021. עוזר הקידוד המופעל על ידי AI, המאפשר למפתחים לבחור מתוך מודלים כמו: Anthropic Claude 3.5 Sonnet, Google Gemini 2.0 Flash ו-OpenAI o3-mini

ו-GPT-4o מסייע למפתחים לכתוב קוד ביעילות רבה יותר באמצעות הצעות קטעי קוד ותגובות צ'אט מודעות הקשר. זה היה צעד נוסף ביצירת פלטפורמת AI ברמה עולמית כדי להעצים לקוחות, יחידים ויוצרים בכל מקום. מאז, GitHub Copilot הפך לכלי קידוד ה-AI המועדף על יותר מ-77,000 ארגונים בכל אזור ותעשייה, והוא מתפתח במהירות למתכנת עמית עם תכונות כמו מצב סוכן וסקירת קוד.

מחשבי Copilot+

הצגת קטגוריה חדשה של מחשבי Windows שתוכננו עבור AI

בהמשך לעבודה שהחלה בשנת 2019 עם הצגת Surface Pro X , מחשבי Copilot+  שהוצגו בשנת 2024 הביאו ארכיטקטורת מערכת חדשה לחלוטין כדי לשלב את עוצמת המעבד המרכזי (CPU) , המעבד הגרפי (GPU) ויחידת עיבוד עצבי (NPU) חדשה בעלת ביצועים גבוהים. תוך ניצול היכולות של ה-NPU, מחשבי Copilot + השיגו רמת ביצועים שלא נראתה כמותה – עד פי 20 יותר חזקים ועד פי 100 יותר יעילים בהרצת עומסי עבודה של AI. זה בישר על מגוון חוויות AI חדשות שהיו בלתי אפשריות בעבר, והפך את ביצוע המשימות במחשב האישי למהיר יותר, פשוט יותר ומותאם אישית יותר.

AutoGen

מסגרת חדשה לבניית סוכני AI

בשנת 2023 הושק AutoGen , מסגרת תכנות בקוד פתוח לבניית סוכני AI ולקידום שיתוף פעולה בין מספר סוכנים כדי לפתור משימות. AutoGen שואף לספק מסגרת קלה וגמישה לשימוש, להאצת פיתוח ומחקר על סוכני AI. תגובת קהילת המפתחים ל-AutoGen סייעה להבין את הצורך ולזהות מקרי שימוש מרכזיים עבור הצעות הסוכנים של מיקרוסופט.

Bing

השקת Bing עם יכולות שפה טבעית

Bing, אשר התפתח מ-Windows Live Search והושק בשנת 2009, הציג כמה תכונות למידת מכונה מתקדמות בעת השקתו. בין התכונות הבולטות היו הצעות חיפוש במהלך הזנת שאילתה ורשימת חיפושים קשורים, הידועה כ-"Explore pane". תכונות אלה עשו שימוש בטכנולוגיה סמנטית שפותחה על ידי Powerset, חברה שמיקרוסופט רכשה בשנת 2008.

פרויקט אוקספורד

פרויקט אוקספורד הניח את היסודות למגוון יכולות AI ב-Azure

Project Oxford

רבות מההתקדמויות הטכניות של מיקרוסופט נבנו על הצלחת Azure. פרויקט זה, ששוחרר בשם קוד בשנת 2015, סיפק למפתחים סט טכנולוגיות חכמות לשימוש בבניית יישומים חכמים הכוללים זיהוי פנים, זיהוי קול והבנת שפה. כיום הוא ידוע כ-Azure AI Foundry.

״כל כך הרבה מזה חוזר ל-Bing״, אמר אריק בויד, סגן נשיא בכיר של פלטפורמת Azure AI במיקרוסופט, שהתחיל את מסעו במיקרוסופט Bing Ads Development . "בנינו תשתית לאימון מודלי AI ולבדיקת הביצועים שלהם. תשתית זו היא חלק מהמוצרים שאנו מציעים כעת דרך Azure AI."

מוצרים חשובים שצמחו מ-Azure כוללים: conversational AI app development, Microsoft Cognitive Services, מכלול של כלי responsible AI. בנוסף, כלי AI בקוד פתוח ושירותי Azure OpenAI, שמשלבים מודלי שפה חזקים עם יכולות ארגוניות של Azure. יותר מ-60,000 ארגונים משתמשים ב-Azure AI Foundry ו-65% מחברות Fortune 500 אימצו את שירות Azure OpenAI.

ResNet

Framework חדש משפר אימון וביצועים של רשתות עצביות עמוקות

פריצת דרך של Microsoft Research, Deep Residual Networks, הידועה גם כ-ResNet, הוצגה בשנת 2015. ה-Residual Learning Framework משפר באופן משמעותי את האימון של רשתות עצביות עמוקות, מה שאפשר פיתוח ארכיטקטורות עמוקות יותר עם ביצועים טובים יותר. הוא סייע לפתוח את הדלת למגוון רחב של יישומים מעשיים, שרבים מהם קריטיים לחיינו כיום.

"ResNet קבעה את הסטנדרט עבור ראייה ממוחשבת שמשמשת בכל מקום", אומר פיטר לי, נשיא Microsoft Research. "אם יש לכם מכונית אוטונומית, היא משתמשת בבינה מלאכותית המבוססת על ResNet. אם אתם עוברים בדיקת MRI במרפאה, מכשיר ה-MRI הזה כולל גם טכנולוגיה המבוססת על ResNet."

פריצות דרך בדיבור, תרגום והבנה

קפיצה בלמידה רב-חושית ורב-לשונית

במשך תקופה של חמש שנים החל משנת 2015, מיקרוסופט השיגה שוויון בביצועים אנושיים במספר מדדים: conversational speech recognition, machine translation, conversational question answering, machine reading comprehension  ו- image captioning.

חמש פריצות אלו היוו את קפיצת המדרגה ביכולות הבינה המלאכותית, בהשגת למידה רב-חושית ורב-לשונית הקרובה יותר לאופן שבו בני אדם לומדים ומבינים. פריצות דרך אלו הובילו את מיקרוסופט לפיתוח של ה-XYZ-Code,  הצומת של שלושה מאפיינים של קוגניציה אנושית: טקסט חד-לשוני (x), אותות אודיו או ויזואליה חושיים(Y)  ורב-לשוניות (Z) – הן שולבו בשירותי Azure AI כדי לעזור ללקוחות להאיץ מערכות AI חזקות ואינטגרטיביות יותר.

Seeing AI:

שיפור הנגישות על ידי הפיכת העולם החזותי לשמיעתי

במטרה ליצור טכנולוגיה שמגבירה את הנגישות, מיקרוסופט הציגה את Seeing AI בשנת 2016. הדוגמה האמיתית לזו של AI משתמשת בראייה ממוחשבת ועיבוד שפה טבעית כדי לתאר את סביבתו של אדם, לקרוא טקסט, לענות על שאלות, לזהות שטרות ואפילו לתאר אנשים סביב והבעות פנים.

האפליקציה עוזרת לאנשים עיוורים או בעלי לקות ראייה להתאים אישית את החוויה שלהם על ידי לימוד הכלי לזהות את הפריטים שהם משתמשים בהם בפועל ועלולים לאבד. אלה עשויים לכלול פריטים קטנים כמו מפתחות לבית או אוזניות אלחוטיות.

נגישות הופכת את הכלים והטכנולוגיות של מיקרוסופט לקלים יותר לשימוש עבור כולם ומאיצה את החדשנות עבור העולם, כולל מוצרים כגון קורא מובנה, המסייע לתלמידים ללמוד לקרוא ולתמוך בקוראים מתחילים ולומדים עם דיסלקציה.

פרויקט Brainwave:

שינוי מהירות עיבוד ה-AI

שנת 2017 סימנה את הגעתה של  Brainwave, פלטפורמת האצת למידה עמוקה שנועדה להריץ עומסי עבודה של AI בזמן אמת ובקנה מידה גדול על תשתית הענן של מיקרוסופט. Brainwave  משלבת מערכי שערים הניתנים לתכנות בשטח (FPGAs) עם תוכנה בעלת ביצועים גבוהים, ומשפרת באופן משמעותי את ביצועי מודלי AI, במיוחד עבור משימות כמו זיהוי תמונה ועיבוד שפה טבעית. Brainwave סימנה קפיצה חשובה באופן שבו מיקרוסופט ניגשה לחומרת AI ולהסקת AI מבוססת ענן.

Turing-NLG:

הנחת היסודות לחדשנות במודלי שפה גדולים

בשנת 2020, מיקרוסופט השיקה את  Turing-NLG ( Natural Language Generation), אחד ממודלי השפה הגדולים ביותר באותה תקופה עם 17 מיליארד פרמטרים. הדבר הציג את ההובלה של מיקרוסופט בפיתוח AI להבנת שפה טבעית והיווה הקדמה לפיתוח מודלים בסיסיים אחרים כמו Florence לזיהוי חזותי.

אינטליגנציה קלינית אמביינטית

Nuance הציגה את הפתרון האמביינטי הראשון לאינטליגנציה קלינית לבריאות

Copilot DAX, המשולב כעת ב-Dragon Copilot, היה צעד משמעותי בתחום הבריאות, תוך שימוש בבינה מלאכותית המופעלת באמצעות קול כדי לאפשר לרופאים לתעד מפגשי מטופלים במהלך שיחה טבעית בין הרופא, המטופל ובני המשפחה. הדבר מאפשר לרופאים להקדיש תשומת לב מלאה כשהם עם מטופליהם ולהפחית את כמות המשימות לאחר שעות העבודה.

בשנת 2020, DAX הפך לזמין, ובשנת 2023, DAX Express הפך לפתרון הראשון לשלב בינה מלאכותית לשיחה וסביבה עם GPT-4. פתרון הבינה המלאכותית הסביבתי זוכה כעת לאמון של יותר מ-600 מערכות בריאות גדולות. הוא מייצר יותר מ-3 מיליון תיעודי טיפול בחודש ונמצא במגמת צמיחה.

Copilot ב-Bing

ה-AI ממציא מחדש את החיפוש ומתחיל גל של חדשנות בחיים ובעבודה

Copilot in Bing

בשנת 2023, Bing ו-Edge החלו להתבסס על AI, ועזרו ליצור שינוי דרמטי באופן שבו אנשים השתמשו בחיפוש. זה גם הוביל להתפתחות מהירה ושילוב של Copilot במגוון המוצרים של מיקרוסופט במהלך השנה שלאחר מכן. Copilot המשיך להתפתח, והפך לא רק לכלי מידע אלא גם לבן לוויה אמיתי של AI עם שחרור אפליקציית Copilot המעודכנת לצרכנים. הצגת יכולות הקול והראייה מאפשרת ל-Copilot להתאים את עצמו למשתמש ולספק תשובות, לעודד ולתת עצות בזמן שאנשים מתמודדים עם אתגרי היום-יום של החיים.

לאחר ההשקה הראשונית ב-Bing בשנת 2023, מיקרוסופט שילבה במהירות את Copilot בשאר המוצרים שלה. Microsoft 365 Copilot עזר לאנשים להיות פרודוקטיביים יותר, בעוד ש-Dynamics 365 ו-Power Platform עזרו לשנות תהליכים עסקיים.

חדשנות מהירה עם  Copilot

7 בפברואר 2023: Copilot ב-Bing

6 במרץ 2023: Microsoft Dynamics 365 Copilot

16 במרץ 2023: Microsoft 365 Copilot

16 במרץ 2023: Copilot ב-Power Platform

22 במרץ 2023: GitHub Copilot X

28 במרץ 2023: Microsoft Security Copilot

20 באפריל 2023: Copilot ב-Microsoft Viva

23 במאי 2023: Copilot ב-Windows

15 בינואר 2024: Copilot Pro

21 במאי 2024: כלי Copilot Studio לבניית סוכנים אוטונומיים

4 בינואר 2024: מקש Copilot התווסף למכשירי Windows 11

1 באוקטובר 2024: חוויית Copilot מעודכנת לצרכנים עם ראייה וקול

15 בינואר 2025: Microsoft 365 Copilot Chat + סוכנים

16 בינואר 2025: Copilot במנויי Microsoft 365 אישיים ומשפחתיים

25 במרץ 2025: Deep reasoning  ב-Microsoft 365

סדרת מודלי שפה קטנים  Phi

יצירת קטגוריית מודלי השפה הקטנים עם Phi

המחקר לחדשנות במוצרים משנת 2024 היה החלוץ בקטגורית Small Language Models כדי לתת פתח לחדשנות חסכונית ומותאמת אישית של מודלים, ולהפוך את הבינה המלאכותית לנגישה ליותר אנשים, למשל, בסמארטפונים ובמכשירים ניידים אחרים הפועלים "בקצה", ולא מחוברים לענן. מאז, מיקרוסופט הציגה גרסאות חוזרות של מודלי Phi לקטלוג המודלים של Azure AI Foundry, כולל מודלי Phi ספציפיים לתעשייה כדי לעזור ללקוחות להתמודד עם מקרי שימוש ספציפיים.

Muse: מודל פעולה כלל עולמי

מודל AI יצירתי ראשון מסוגו למשחקים

מודל Muse ששוחרר בשנת 2025  הוא פריצת דרך בהגיית רעיונות למשחקים. הוא מפתח הבנה מעמיקה של הסביבה, כולל הדינמיקה שלה וכיצד היא מתפתחת עם הזמן בתגובה לפעולות. היכולות של ChatGPT ו-GPT-4 ללמוד שפה אנושית הפך כעת לבר השוואה ליכולת הבינה המלאכותית ללמוד את המכניקה של איך דברים עובדים, ובכך להבין מעשית אינטראקציות בעולם. דבר זה פותח את היכולת לבצע גרסאות חוזרות מהירות, לבצע רמיקס וליצור במשחקי וידאו, כך שמפתחים יוכלו בסופו של דבר ליצור סביבות סוחפות ולשחרר את מלוא היצירתיות שלהם.

ההתקדמות הזו היא רק התחלת המחויבות של מיקרוסופט לבינה מלאכותית ולפוטנציאל שלה לסייע בהשגת המשימה של העצמת כל אדם וכל ארגון על פני כדור הארץ להשיג יותר באמצעות שיתוף פעולה וחדשנות. משיפור הטיפול הרפואי ועד להגנה על המגוון הביולוגי ועד לשינוי הלמידה, האפשרויות וההשפעה של הבינה המלאכותית נותרו אינסופיות.

"מה שחשוב באמת במחקר הוא לא רק קידום מצב הידע במונחים טכניים, אלא גם הבטחה שפריצות הדרך הללו יוכלו לאפשר מערכת אקולוגית רחבה יותר", אמר לי.

"זה חשוב יותר מתמיד, מכיוון שקצב השינוי גדל מאוד. אחד הדברים שאני מוצא בהם השראה במיקרוסופט, כחברת פלטפורמה, הוא שאנחנו מקדמים את מצב הבינה המלאכותית במקביל לכך שאנחנו עוזרים ללקוחות שלנו לנצל את הטכנולוגיה הטרנספורמטיבית הזו."

מוזמנות ומוזמנים להמשיך לעקוב אחר מרכז הפיתוח והמחקר של מיקרוסופט בישראל גם בעמודים שלנו בפייסבוק, באינסטגרם, בטיקטוק ובאתר שלנו.