![]() 本文由作者參加九派新聞直播九派圓桌《manus爆火,套殼還是創新》討論時的發言整理而成,發布前經作者審閱 【1】manus更多是個營銷事件 manus向普通的非專業人士很好的解釋了什么是 AI 智能體,雖然人工智能比較火爆,但走入平常家庭有點遠的。普通人一定關心的就是,你跟我的實際生活有什么關系。 它談到說我可以看簡歷、篩簡歷,在很多企業里面,員工需要寫簡歷, HR 需要看簡歷,經理層需要招人。大家一下子就能夠理解到,原來一個智能體能做簡歷工作;以后我在面試的時候,過的第一關可能不是人,是 AI,讓 AI 挑選,而不是人類挑選。如果 AI 這關都過不去,就沒機會見到真人了。 另外,這個名字也挺好的,解釋了智能體是什么,就是腦袋和手的關系。它是手的延伸,這個類比不一定準確,學術上經不起推敲,但不妨礙普通大眾理解:你就是替我干活的,你就是替代我的雙手的。 我們用的很多軟件,不管是豆包,還是通義千問、智譜等AI 工具,都有一個界面叫智能體,你點開那個智能體,他跟你互動還是問答機器人,并不是完成一個任務,manus 告訴大家,智能體不是一個問答機器人,是幫你完成一件工作。 另外,它還賣了一個概念,叫全球第一個通用智能體,事實上,它離通用還差太遠,實現 AGI還很遠很遠,但它把概念宣傳出來,占了一個很好的身位,這樣就引起了很多人的好奇,通用的人工智能來了,那我是不是被替代掉了? 它的爆火與 deep seek 是完全不一樣的。DS是我拿任何產品過來,你來用,你覺得好,就推薦給別人。大家一起來用,它成了全球互聯網產品用戶增長最快的一個APP。manus 是反其道的,它知道如果硬搞,可能經不起太多的人來質疑、使用、破解,于是采用了一個邀請碼的方法,設了一道饑餓營銷的門檻,調取了很多人的好奇心。 一句話,我覺得更多是個營銷事件。 從媒體報道來看,已經有投資方和manus接洽,我們也看到了阿里和它達成了合作。這是一件好事情,關于AI領域的投資,從投資人的角度來看,投資偏好不存在說技術崇拜或者是應用落地,只看投資回報。投技術,它就意味著投資大,風險大,受益大,投應用,他可能就會看,應用的門檻有多高?TO B 還是 TO C 的?二者的投資邏輯不太一樣。 manus說他是一個應用落地的故事,非技術,一旦要談 AI 的技術,就一定要談三件事情:算力、算法、數據,如果這三個都跟你沒關系,大概率技術跟你無關, manus 很少提到它在算力方面的優勢,算法和數據的突破幾乎都沒有。更多是怎么去多場景的技術實現:做了大量的交互體驗和公式化動作,這里的投資邏輯自然就是應用了。 manus自己的宣傳是偏 to C 的,看起來的應該是個 C 端消費者的AI 助理 、AI 助手的角色。 不同的基金,不同的投資人,選擇不太一樣,朱嘯虎比較堅定,投應用,他覺得在中國能夠把應用做好是比較有把握的。但我們也知道,目前 AI 領域,中國最有價值的投資公司,肯定是深度求索。投資人不會因為說意識到熱點,去改變太多投資邏輯。他會看領域里的方向,投資回報和能看得懂的商業模式。 很多人關心,機器會不會替代人,圖靈獎獲得者楊立昆教授,認為基于現在的 transformer 架構,不可能走向真正的通用人工智能,普通人也不要那么焦慮、緊張。雖然 ai 發展很快,但替代人,目前從技術底層上來說,做不到,沒這個可能性,不要去信很多的那種博流量的言語,純粹是販賣焦慮。 但從工作的角度來說,我們很多人會感到恐懼,會不會被人工智能所替代,這里我的答案非常肯定:yes,而且已經發生、正在發生,有些工種會因為 AI 的出現消失掉,比如客服和接線員, 你接電話的那個對方是一個人還是一個人工智能,大部分人已經分不清楚了。 當然,AI 的出現也會創造出大量新的崗位。美國有個非常著名的公司,叫 salesforce,全球排第一的 crm saas 軟件公司,市值大概是3000多億美金,公司的CEO 2024年底宣布2025年不再招聘軟件工程師,為什么呢?因為平臺 agent force 已經提高了30%的工作效率,大部分工作, AI 就能完成。 但需要大量的招聘銷售人員幫他賣agent force ,普通的大眾要相信,如果不用 AI,就好像蒸汽機出現,大馬路上已經有了奔馳車,你還當一個馬車夫,干嘛不學一下開車?AI 帶來的就是智力勞動效率的提升。 我們知道汽車工廠有汽車流水線,牛奶工廠有牛奶流水線。這些流水線核心是機器,人類屬于配套,未來智力流水線如果出現了,工作的人可能就是 AI 的配套。但這并不意味著,人就沒有工作了。還是有人要做汽車設計、規劃、宣傳。 ![]() 【2】將來大概就是多智能體協同 AI 驅動的決策與之前系統驅動的決策有個不一樣,就是端到端的能力。 什么叫端到端的能力?我舉個例子,2016年, AlphaGo 打敗了李世石之后,人類下棋再也下不過人工智能了。圍棋有361個落點,每個落點的可能性是個天文數字,AI 來做決策,并沒有說規劃、理解,只把圖案和規則告訴它,它就能告訴我們下一步,這就是端到端的能力。 未來通用智能體提供端到端的解決方案才是主流。我認為現在理解意圖,再規劃,再做執行的方案,這是一個經典的人類線性解決問題的方法,反應速度非常慢,而我們大腦解決問題是并發計算的,好多神經元連一塊兒構成了認知體系。現在的智能體應用,靠網絡并行計算,完了還得用線性方法再解釋一遍,再接著處理,這就好比把本來運行得挺高效、像大海一樣的網絡體系,弄成了一條小水溝,效率顯然不高,不經濟,不劃算。 最好的方法是多個大模型協同,一個綜合的大腦決定哪些參數起作用,幾個大模型協同給決策,將來大概就是多智能體協同。一個智能體把一切都搞定、很難,人類都有不同的專業分工,我們根據自己的能力都會有不同的擅長領域,未來的智能體也會如此,這里面就牽扯到多智能體協同,比如標準在哪里、如何定義標準,如何規范。 這是 manus 給我們提出的很重要的問題,一個系統智能的問題,不是單一智能的問題,針對人、機、環境三個環節,如果協同標準只是某一個,比方說純粹的 AI 標準,不考慮人、不考慮環境,大概率不行,將來 AI 應用發展,這個越早確立,會越早地把資源優勢發揮出來。 manus被說套殼,我覺得不是問題,核心問題是用了別人的基礎大模型之后,做了什么?舉個例子,有些人說我做行業大模型,需要另外提供一些數據集,根據我的場景需要,在別人的基礎上再進行訓練,從而調整為比較適合行業場景的大模型。它是一種微調技術,我不知道manus有沒有做。目前公開數據沒有,也沒有宣傳,如果沒有做這件事情,純粹用基模再加上提示詞工程,再加上 python 的開發代碼環境,就完成了工程化,坦率來講,門檻太低。它關于意圖識別任務、規劃、執行的監督、價值觀對齊,如果都只是用提示式工程來做,那大概率稍微復雜一點的任務就會協同不了。 當然,公眾也不要小看 manus干的工作,工程化這件事情很難,有個測試基準GAIA(通用人工智能助手的測試標準),manus 的考試成績不錯,比 OpenAI的operator、 deepresearch要強,說明工程量做得很不錯,至少提示詞、工程技術,其他的小工具做的很好,這里折射出了另外一個創業的機會或者掙錢的機會。你挑一兩個非常熟悉的領域,用現在的 AI 大模型,再加上提示工程和寫代碼的技術,你很可能做出一個非常好用的 AI 助手出來。 有人會問,測試基準的目的是什么?建立一個評測標準來評測 AI 的系統工具,測試智能體的,參與者有 meta。標準比較權威、嚴肅,但僅僅是一個標準而已。大家可以看一下 deepseek v3模型和 r1模型亮出自己考過的標準,你會發現他們的測試集可能有幾十上百個,其中有個很重要的標準GPQA——博士研究生水平的基準測試,deep seek R1 模型考了70多分,人類相關領域的博士平均分數65分。如果不是相關領域的,可能只能拿到30多分,反過來看manus,它能拿出來 PK 的測試集特別少。 這就好比說我們去考試,有一個人說,全世界所有的考卷都來一遍。有人會說我就會一科。作為一個通用agent ,就給人感覺有點單薄。 從全球的角度來說,開源生態比較繁榮的往往都偏技術,不偏應用。比方說linux 開源社區,很厲害的,還有 java 開源社區、app ,這些都偏技術、太偏底層,但一旦到了應用層,往往很少開源。舉個例子,我們說開源的 ERP、開源的辦公協同軟件,開源的 CRM 軟件,這些在整個業界生態的聲音很小。 linux一定是個很重要的主流操作系統之一,大量的人做貢獻, AI 領域大概會遵循同樣的邏輯,如果偏技術,開源會是一個不錯的選擇,如果智能體框架開源,我持保守的態度,智能體偏應用,這種產品閉源能夠走得更遠一點。 開源往往意味著程序員做貢獻。程序員對于業務很多場景不那么了解,甚至不那么在乎,更愿意炫技,說算法多好,問題解決的可復用性、通用性多好、效率多高,這些東西在應用環節里,可能不是最重要的,好的客戶體驗才最重要。 【3】transformer 架構的能力已經壓榨到頂點 AI 最先的哪個地方落地,得看投資回報,哪個地方投資回報最大,落地就最快。現在看,回報排第一的是金融,deepseek 的母公司就是幻方量化,做金融投資的私募股權基金。事實上很多基金公司,很早就大量使用機器學習、人工智能,在大語言模型還沒有出來之前,當初的卷積神經網絡或者說機器學習應用就非常多。 股票就是漲和跌。卷積神經網絡根據大量的數據采集來做預測,預測明天是漲還是跌,第二個領域是生物制藥、醫療。很多 AI 專家,實驗室背后都跟制藥、生物有關系, AI 教母李飛飛在斯坦福的實驗室,就跟很多醫療機構有合作。她是三院院士,有個院士頭銜就跟醫療有關,2024年諾貝爾獎獲得者用deepfolder 發現了蛋白質折疊,本質就是生物醫藥的問題。 一個 agent要能夠很好地完成任務,是挺耗算力的,需要燒很多 token 。我們知道某一個企業部署了一套deepseek,就希望通過它去賣錢,一個月虧了四個多億。他發現這個賬怎么算不明白了,這里意味著好東西是有代價的。 不知道大家有沒有注意到,以前OpenAI每次發布產品,全球轟動,但最近上線了一個產品GPT4.5,熱度實在不高。不如 manus。GPT4以后,transformer 架構的能力可以說已經壓榨到了頂點了,4.5出來之后沒有產生轟動效應、GPT5的難產,說明了一件事情,如果底層架構沒有新的變化,將來后續的版本都不會發生量變,可能是一個微調的概念,不會產生數量級變化。 另外我想多說一兩句,在AI時代,家長對于小孩的培養,首先,填鴨式的應試教育大概率是不行的,如果小孩被教育得沒有童年、沒有樂趣,厭學,您可以停手了,再教育下去這個孩子到高中階段,會突然間一腳踏空,第二,讓年輕人有想象力、有創造力,比他懂什么更重要,哪怕他調皮一點、搗蛋一下,不要去責怪他。乖孩子在 AI 時代,可能就是個沒用的人,當然調皮下不是去危害社會。最后,讓他有一個自己的愛好,有一個自己喜歡的事情,愿意長期干的事情。未來,人類的工作狀態會是什么樣子,我們真的無從知曉,但是我們知道,如果一個人干著他愛的事情,不管是工作還是生活,能夠開心快樂,這也許是一種非常好的生活狀態。 |
|