微軟 Build 2024開發(fā)者大會

2024.05.21

當?shù)貢r間5月21日,微軟Build 2024年度全球開發(fā)者大會在美國西雅圖召開,微軟CEO Satya Nadella在大會上致辭,側(cè)重于Windows和AI的介紹,并一連發(fā)布了60多種新產(chǎn)品和解決方案。

  首先,Nadella提出了兩個貫穿全局的核心問題:

  1. 在這個資訊激增的時代里,PC如何幫我們利用這些資訊進行快速推理、計劃和行動?

  2. 計算機可以主動理解我們,而我們不必了解計算機嗎?

  

“Copilot+PC”預熱


  在這場大會的前一天,微軟先舉辦了一場有關(guān)“Surface和Windows AI”的預熱活動,發(fā)布了新一代Surface以及全新AI功能——Recall,從而正式宣告了Copilot+PC的面世。

  據(jù)了解,新一代Surface分為第七代Surface Laptop和第十一代Surface Pro兩種機型,搭載了高通新品驍龍X Elite芯片,附加Prism技術(shù)以全面轉(zhuǎn)向ARM陣營。Recall則是通過整合Copilot的“回溯”功能(學習、理解及推理能力),借助大模型追蹤用戶操作,支持以時間線的形式調(diào)用有關(guān)內(nèi)容和操作的“回放”。

  對于Copilot+PC來說,其主要OEM包括AMD、英特爾和高通,以及宏碁、華碩、戴爾、惠普、聯(lián)想和三星等眾多知名大廠。其中,前三者負責微軟PC的芯片制造,而后幾位則是微軟的設備合作伙伴,其PC產(chǎn)品即將搭載微軟的AI模型。

  微軟副總裁兼消費品類首席營銷官Yusuf Mehdi介紹,Windows 11 AI PC是有史以來最強大的 Windows PC,融合了多種突破性的AI體驗,并預計該款AI PC明年銷量可達5,000萬臺。

  Nadella還表示:“蘋果在多個方面都表現(xiàn)得極為出色,我們現(xiàn)在正期待Windows與Mac能夠重新展開真正意義上的對決。”

  

Copilot產(chǎn)品線


  顯而易見的是,Copilot在這場開發(fā)者大會的地位相當重要:一方面,它能夠更加流暢地幫助個人用戶處理繁雜的工作;另一方面,Copilot也讓團隊協(xié)作變得輕松自如。

  

  Team Copilot

  對于職場人來說,Team Copilot使Copilot“擬人化”,Copilot將不再是一個“旁觀者”,而直接化身為團隊成員,在Teams、Loop、Planner等協(xié)作應用中直接受調(diào)用。

  例如,Copilot作為會議主持人,管理議程并實時記錄要點;或充當協(xié)作者,提取重要信息并解決遺留問題;甚至作為項目經(jīng)理,通過創(chuàng)建和分配任務、跟蹤截止日期等方式推動團隊協(xié)作等等……其預覽版本將于今年晚些時候推出。

  Copilot Agent代理功能

  該功能推出后,在Microsoft Copilot Studio的開發(fā)者們將可以根據(jù)特定任務和功能,構(gòu)建可以主動響應數(shù)據(jù)和事件的Copilot,它可通過記憶和知識理解上下文、推理操作和輸入,基于用戶反饋進行學習,從而獨立、自主地管理復雜、長期運行的業(yè)務流程,并有望進化為全自動的AI Agent。

  微軟業(yè)務應用和平臺的公司副總裁Charles Lamanna表示:“我們很快意識到,僅限于對話的Copilot在當今所能做的事情上是非常有限的,與其讓Copilot等待有人與其聊天,不如讓它更主動,在后臺執(zhí)行自動化任務。

  

  GitHub Copilot Extensions

  大會上,Nadella稱GitHub Copilot為“這個AI時代的第一款熱門產(chǎn)品”。作為最廣泛采用的AI開發(fā)工具之一,GitHub Copilot的訂閱用戶已經(jīng)突破180萬人。

  而今,微軟又進一步與100多家合作伙伴推出GitHub Copilot Extensions,一改此前“補全代碼”的常態(tài),化身效率提升神器——通過對話整合所有開發(fā)流程,減少上下文切換,讓開發(fā)者專注于核心代碼內(nèi)容。

  不論是語音輸入還是文字輸入,不論是Java還是Python,輸入語言也沒有任何限制,只要提出需求,GitHub Copilot都能作出開發(fā)者需要的代碼。不僅如此,它還能回答有關(guān)開發(fā)過程的問題,并支持多種開發(fā)工具和平臺。

  Copilot堆棧&Fabric實時智能

  2023年里,微軟成功構(gòu)建了Microsoft Copilot并更新了150多個迭代版本,并開發(fā)出Copilot堆棧,為開發(fā)人員賦予了更高的自由度。

  在此基礎上,微軟在今年為開發(fā)者們升級了Copilot堆棧,使其可以構(gòu)建自己的AI應用程序、解決方案和多樣體驗。據(jù)介紹,Windows Copilot庫包含了40多種端側(cè)AI模型,包括Windows兼容的API和算法。

  另外,Nadella還宣布在Microsoft Fabric上推出實時智能(Real-Time Intelligence),這個受AI驅(qū)動的分析平臺可為組織提供即時決策和SaaS服務等,不僅幫助數(shù)據(jù)分析人員獲得簡單的低代碼或無代碼體驗,也能通過代碼豐富的用戶界面讓專業(yè)開發(fā)者受益。

  

  

GPT-4o和Phi-3-vision


  作為OpenAI最大的投資方,微軟也獲得了OpenAI所有AI模型的優(yōu)先使用權(quán)。

  上周,OpenAI最新發(fā)布的多模態(tài)模型GPT-4o正是在Azure上訓練的,現(xiàn)已在Azure AI Studio中作為API提供,支持多模式輸入和輸出,為企業(yè)用戶和開發(fā)者帶來更多創(chuàng)作空間。微軟CTO Kevin Scott也戲稱,GPT-4o比原始模型便宜了12倍左右。

  而在這場盛會的最后,OpenAI CEO Sam Altman也驚喜現(xiàn)身于會場,并透露了微軟正在開發(fā)可承載GPT-5高算力需求的超級計算機的消息。

  除了GPT-4o,微軟開發(fā)的Phi-3系列AI小語言模型也發(fā)布了一款全新多模態(tài)模型Phi-3-vision,與前任Phi-3-mini和Phi-3-medium一起,通過Azure AI的MaaS產(chǎn)品面向用戶。

  據(jù)了解,Phi-3-vision具備音頻和視覺功能,能夠讀取文本并分析圖片,且其較小規(guī)模(42億參數(shù)量)適用于移動設備。不過,與DALL-E和Stable Diffusion不同,Phi-3-vision不會生成圖像,主要用來理解圖像中的內(nèi)容并為用戶進行分析,目前已進入預覽階段。

  

擴大AI合作關(guān)系網(wǎng)


  與英偉達

  微軟方面稱,其與英偉達欲合作推動全球制造業(yè)的數(shù)字化進程,基于微軟Azure的英偉達全宇宙云應用編程接口(Omniverse Cloud API)將為用于設計、構(gòu)建和操作工業(yè)數(shù)字孿生工具的軟件,帶來數(shù)據(jù)互操作性、協(xié)作和基于物理世界的可視化等重要功能。

  與Meta

  微軟宣布,將微軟混合現(xiàn)實應用程序(Windows Volumetric Apps)引入Meta Quest頭顯設備,使開發(fā)人員能夠?qū)⑵鋺贸绦驍U展到3D空間,該擴展將允許用戶不離開支持他們工作依賴的應用程序,同時增強空間理解的能力。

  與可汗學院

  這一多元合作伙伴關(guān)系的重點在于利用AI技術(shù)為教育材料提供支持。微軟將為美國所有K-12教育者免費提供AI教育助手Khanmigo for Teachers,并捐贈Azure AI優(yōu)化的基礎架構(gòu)權(quán)限。

  可汗學院方面則會借助微軟開發(fā)的Phi-3最新版本,探索經(jīng)濟實惠、可擴展且適應性強的方式改進數(shù)學輔導,并計劃將更多可汗學院的教學內(nèi)容引入Copilot和Microsoft Teams教育版,提供更多學習資源。

  

  

其它亮點


  Edge實時視頻翻譯

  該功能將支持實時語音同傳翻譯,適用范圍包括YouTube、LinkedIn、Reuters和Coursera等主流網(wǎng)站影片,但只支持英語、印地語、德語、俄語、意大利語和西班牙語的雙向互譯。微軟也表示,后續(xù)將會添加更多的語言和視頻平臺。

  Teams定制Emoji

  七月,微軟Teams將全面上線定制表情符號功能,讓用戶更有創(chuàng)意、更加真實地表達自己。企業(yè)IT管理員將可以限制哪些用戶可以上傳或刪除自定義表情符號,或完全關(guān)閉該功能。自定義表情符號將盡在同一組織域中可見。

  Windows 11的AI剪貼板功能

  據(jù)悉,“高級粘貼(Advanced Paste)”功能現(xiàn)已于PowerToys 0.81版本推出,啟用后,用戶可使用“Windows+Shift+V”喚醒該功能,從而可以在粘貼內(nèi)容時進行格式轉(zhuǎn)換,如純文本、markdown或JSON。