
微軟 Build 2024開發(fā)者大會(huì)
2024.05.21
當(dāng)?shù)貢r(shí)間5月21日,微軟Build 2024年度全球開發(fā)者大會(huì)在美國(guó)西雅圖召開,微軟CEO Satya Nadella在大會(huì)上致辭,側(cè)重于Windows和AI的介紹,并一連發(fā)布了60多種新產(chǎn)品和解決方案。
首先,Nadella提出了兩個(gè)貫穿全局的核心問題:
在這個(gè)資訊激增的時(shí)代里,PC如何幫我們利用這些資訊進(jìn)行快速推理、計(jì)劃和行動(dòng)?
計(jì)算機(jī)可以主動(dòng)理解我們,而我們不必了解計(jì)算機(jī)嗎?
“Copilot+PC”預(yù)熱
在這場(chǎng)大會(huì)的前一天,微軟先舉辦了一場(chǎng)有關(guān)“Surface和Windows AI”的預(yù)熱活動(dòng),發(fā)布了新一代Surface以及全新AI功能——Recall,從而正式宣告了Copilot+PC的面世。
據(jù)了解,新一代Surface分為第七代Surface Laptop和第十一代Surface Pro兩種機(jī)型,搭載了高通新品驍龍X Elite芯片,附加Prism技術(shù)以全面轉(zhuǎn)向ARM陣營(yíng)。Recall則是通過整合Copilot的“回溯”功能(學(xué)習(xí)、理解及推理能力),借助大模型追蹤用戶操作,支持以時(shí)間線的形式調(diào)用有關(guān)內(nèi)容和操作的“回放”。
對(duì)于Copilot+PC來(lái)說(shuō),其主要OEM包括AMD、英特爾和高通,以及宏碁、華碩、戴爾、惠普、聯(lián)想和三星等眾多知名大廠。其中,前三者負(fù)責(zé)微軟PC的芯片制造,而后幾位則是微軟的設(shè)備合作伙伴,其PC產(chǎn)品即將搭載微軟的AI模型。
微軟副總裁兼消費(fèi)品類首席營(yíng)銷官Yusuf Mehdi介紹,Windows 11 AI PC是有史以來(lái)最強(qiáng)大的 Windows PC,融合了多種突破性的AI體驗(yàn),并預(yù)計(jì)該款A(yù)I PC明年銷量可達(dá)5,000萬(wàn)臺(tái)。
Nadella還表示:“蘋果在多個(gè)方面都表現(xiàn)得極為出色,我們現(xiàn)在正期待Windows與Mac能夠重新展開真正意義上的對(duì)決?!?/span>
Copilot產(chǎn)品線
顯而易見的是,Copilot在這場(chǎng)開發(fā)者大會(huì)的地位相當(dāng)重要:一方面,它能夠更加流暢地幫助個(gè)人用戶處理繁雜的工作;另一方面,Copilot也讓團(tuán)隊(duì)協(xié)作變得輕松自如。
Team Copilot
對(duì)于職場(chǎng)人來(lái)說(shuō),Team Copilot使Copilot“擬人化”,Copilot將不再是一個(gè)“旁觀者”,而直接化身為團(tuán)隊(duì)成員,在Teams、Loop、Planner等協(xié)作應(yīng)用中直接受調(diào)用。
例如,Copilot作為會(huì)議主持人,管理議程并實(shí)時(shí)記錄要點(diǎn);或充當(dāng)協(xié)作者,提取重要信息并解決遺留問題;甚至作為項(xiàng)目經(jīng)理,通過創(chuàng)建和分配任務(wù)、跟蹤截止日期等方式推動(dòng)團(tuán)隊(duì)協(xié)作等等……其預(yù)覽版本將于今年晚些時(shí)候推出。
Copilot Agent代理功能
該功能推出后,在Microsoft Copilot Studio的開發(fā)者們將可以根據(jù)特定任務(wù)和功能,構(gòu)建可以主動(dòng)響應(yīng)數(shù)據(jù)和事件的Copilot,它可通過記憶和知識(shí)理解上下文、推理操作和輸入,基于用戶反饋進(jìn)行學(xué)習(xí),從而獨(dú)立、自主地管理復(fù)雜、長(zhǎng)期運(yùn)行的業(yè)務(wù)流程,并有望進(jìn)化為全自動(dòng)的AI Agent。
微軟業(yè)務(wù)應(yīng)用和平臺(tái)的公司副總裁Charles Lamanna表示:“我們很快意識(shí)到,僅限于對(duì)話的Copilot在當(dāng)今所能做的事情上是非常有限的,與其讓Copilot等待有人與其聊天,不如讓它更主動(dòng),在后臺(tái)執(zhí)行自動(dòng)化任務(wù)。”
GitHub Copilot Extensions
大會(huì)上,Nadella稱GitHub Copilot為“這個(gè)AI時(shí)代的第一款熱門產(chǎn)品”。作為最廣泛采用的AI開發(fā)工具之一,GitHub Copilot的訂閱用戶已經(jīng)突破180萬(wàn)人。
而今,微軟又進(jìn)一步與100多家合作伙伴推出GitHub Copilot Extensions,一改此前“補(bǔ)全代碼”的常態(tài),化身效率提升神器——通過對(duì)話整合所有開發(fā)流程,減少上下文切換,讓開發(fā)者專注于核心代碼內(nèi)容。
不論是語(yǔ)音輸入還是文字輸入,不論是Java還是Python,輸入語(yǔ)言也沒有任何限制,只要提出需求,GitHub Copilot都能作出開發(fā)者需要的代碼。不僅如此,它還能回答有關(guān)開發(fā)過程的問題,并支持多種開發(fā)工具和平臺(tái)。
Copilot堆棧&Fabric實(shí)時(shí)智能
2023年里,微軟成功構(gòu)建了Microsoft Copilot并更新了150多個(gè)迭代版本,并開發(fā)出Copilot堆棧,為開發(fā)人員賦予了更高的自由度。
在此基礎(chǔ)上,微軟在今年為開發(fā)者們升級(jí)了Copilot堆棧,使其可以構(gòu)建自己的AI應(yīng)用程序、解決方案和多樣體驗(yàn)。據(jù)介紹,Windows Copilot庫(kù)包含了40多種端側(cè)AI模型,包括Windows兼容的API和算法。
另外,Nadella還宣布在Microsoft Fabric上推出實(shí)時(shí)智能(Real-Time Intelligence),這個(gè)受AI驅(qū)動(dòng)的分析平臺(tái)可為組織提供即時(shí)決策和SaaS服務(wù)等,不僅幫助數(shù)據(jù)分析人員獲得簡(jiǎn)單的低代碼或無(wú)代碼體驗(yàn),也能通過代碼豐富的用戶界面讓專業(yè)開發(fā)者受益。
GPT-4o和Phi-3-vision
作為OpenAI最大的投資方,微軟也獲得了OpenAI所有AI模型的優(yōu)先使用權(quán)。
上周,OpenAI最新發(fā)布的多模態(tài)模型GPT-4o正是在Azure上訓(xùn)練的,現(xiàn)已在Azure AI Studio中作為API提供,支持多模式輸入和輸出,為企業(yè)用戶和開發(fā)者帶來(lái)更多創(chuàng)作空間。微軟CTO Kevin Scott也戲稱,GPT-4o比原始模型便宜了12倍左右。
而在這場(chǎng)盛會(huì)的最后,OpenAI CEO Sam Altman也驚喜現(xiàn)身于會(huì)場(chǎng),并透露了微軟正在開發(fā)可承載GPT-5高算力需求的超級(jí)計(jì)算機(jī)的消息。
除了GPT-4o,微軟開發(fā)的Phi-3系列AI小語(yǔ)言模型也發(fā)布了一款全新多模態(tài)模型Phi-3-vision,與前任Phi-3-mini和Phi-3-medium一起,通過Azure AI的MaaS產(chǎn)品面向用戶。
據(jù)了解,Phi-3-vision具備音頻和視覺功能,能夠讀取文本并分析圖片,且其較小規(guī)模(42億參數(shù)量)適用于移動(dòng)設(shè)備。不過,與DALL-E和Stable Diffusion不同,Phi-3-vision不會(huì)生成圖像,主要用來(lái)理解圖像中的內(nèi)容并為用戶進(jìn)行分析,目前已進(jìn)入預(yù)覽階段。
擴(kuò)大AI合作關(guān)系網(wǎng)
與英偉達(dá)
微軟方面稱,其與英偉達(dá)欲合作推動(dòng)全球制造業(yè)的數(shù)字化進(jìn)程,基于微軟Azure的英偉達(dá)全宇宙云應(yīng)用編程接口(Omniverse Cloud API)將為用于設(shè)計(jì)、構(gòu)建和操作工業(yè)數(shù)字孿生工具的軟件,帶來(lái)數(shù)據(jù)互操作性、協(xié)作和基于物理世界的可視化等重要功能。
與Meta
微軟宣布,將微軟混合現(xiàn)實(shí)應(yīng)用程序(Windows Volumetric Apps)引入Meta Quest頭顯設(shè)備,使開發(fā)人員能夠?qū)⑵鋺?yīng)用程序擴(kuò)展到3D空間,該擴(kuò)展將允許用戶不離開支持他們工作依賴的應(yīng)用程序,同時(shí)增強(qiáng)空間理解的能力。
與可汗學(xué)院
這一多元合作伙伴關(guān)系的重點(diǎn)在于利用AI技術(shù)為教育材料提供支持。微軟將為美國(guó)所有K-12教育者免費(fèi)提供AI教育助手Khanmigo for Teachers,并捐贈(zèng)Azure AI優(yōu)化的基礎(chǔ)架構(gòu)權(quán)限。
可汗學(xué)院方面則會(huì)借助微軟開發(fā)的Phi-3最新版本,探索經(jīng)濟(jì)實(shí)惠、可擴(kuò)展且適應(yīng)性強(qiáng)的方式改進(jìn)數(shù)學(xué)輔導(dǎo),并計(jì)劃將更多可汗學(xué)院的教學(xué)內(nèi)容引入Copilot和Microsoft Teams教育版,提供更多學(xué)習(xí)資源。
其它亮點(diǎn)
Edge實(shí)時(shí)視頻翻譯
該功能將支持實(shí)時(shí)語(yǔ)音同傳翻譯,適用范圍包括YouTube、LinkedIn、Reuters和Coursera等主流網(wǎng)站影片,但只支持英語(yǔ)、印地語(yǔ)、德語(yǔ)、俄語(yǔ)、意大利語(yǔ)和西班牙語(yǔ)的雙向互譯。微軟也表示,后續(xù)將會(huì)添加更多的語(yǔ)言和視頻平臺(tái)。
Teams定制Emoji
七月,微軟Teams將全面上線定制表情符號(hào)功能,讓用戶更有創(chuàng)意、更加真實(shí)地表達(dá)自己。企業(yè)IT管理員將可以限制哪些用戶可以上傳或刪除自定義表情符號(hào),或完全關(guān)閉該功能。自定義表情符號(hào)將盡在同一組織域中可見。
Windows 11的AI剪貼板功能
據(jù)悉,“高級(jí)粘貼(Advanced Paste)”功能現(xiàn)已于PowerToys 0.81版本推出,啟用后,用戶可使用“Windows+Shift+V”喚醒該功能,從而可以在粘貼內(nèi)容時(shí)進(jìn)行格式轉(zhuǎn)換,如純文本、markdown或JSON。