AI目前在技術底層上難以取代人類

天承辦公室 2025-03-24 發布于北京

展開全文

本文由作者參加九派新聞直播九派圓桌《manus爆火，套殼還是創新》討論時的發言整理而成，發布前經作者審閱

【1】manus更多是個營銷事件

manus向普通的非專業人士很好的解釋了什么是 AI 智能體，雖然人工智能比較火爆，但走入平常家庭有點遠的。普通人一定關心的就是，你跟我的實際生活有什么關系。

它談到說我可以看簡歷、篩簡歷，在很多企業里面，員工需要寫簡歷， HR 需要看簡歷，經理層需要招人。大家一下子就能夠理解到，原來一個智能體能做簡歷工作；以后我在面試的時候，過的第一關可能不是人，是 AI，讓 AI 挑選，而不是人類挑選。如果 AI 這關都過不去，就沒機會見到真人了。

另外，這個名字也挺好的，解釋了智能體是什么，就是腦袋和手的關系。它是手的延伸，這個類比不一定準確，學術上經不起推敲，但不妨礙普通大眾理解：你就是替我干活的，你就是替代我的雙手的。

我們用的很多軟件，不管是豆包，還是通義千問、智譜等AI 工具，都有一個界面叫智能體，你點開那個智能體，他跟你互動還是問答機器人，并不是完成一個任務，manus 告訴大家，智能體不是一個問答機器人，是幫你完成一件工作。

另外，它還賣了一個概念，叫全球第一個通用智能體，事實上，它離通用還差太遠，實現 AGI還很遠很遠，但它把概念宣傳出來，占了一個很好的身位，這樣就引起了很多人的好奇，通用的人工智能來了，那我是不是被替代掉了？

它的爆火與 deep seek 是完全不一樣的。DS是我拿任何產品過來，你來用，你覺得好，就推薦給別人。大家一起來用，它成了全球互聯網產品用戶增長最快的一個APP。manus 是反其道的，它知道如果硬搞，可能經不起太多的人來質疑、使用、破解，于是采用了一個邀請碼的方法，設了一道饑餓營銷的門檻，調取了很多人的好奇心。

一句話，我覺得更多是個營銷事件。

從媒體報道來看，已經有投資方和manus接洽，我們也看到了阿里和它達成了合作。這是一件好事情，關于AI領域的投資，從投資人的角度來看，投資偏好不存在說技術崇拜或者是應用落地，只看投資回報。投技術，它就意味著投資大，風險大，受益大，投應用，他可能就會看，應用的門檻有多高？TO B 還是 TO C 的？二者的投資邏輯不太一樣。

manus說他是一個應用落地的故事，非技術，一旦要談 AI 的技術，就一定要談三件事情：算力、算法、數據，如果這三個都跟你沒關系，大概率技術跟你無關， manus 很少提到它在算力方面的優勢，算法和數據的突破幾乎都沒有。更多是怎么去多場景的技術實現：做了大量的交互體驗和公式化動作，這里的投資邏輯自然就是應用了。

manus自己的宣傳是偏 to C 的，看起來的應該是個 C 端消費者的AI 助理、AI 助手的角色。

不同的基金，不同的投資人，選擇不太一樣，朱嘯虎比較堅定，投應用，他覺得在中國能夠把應用做好是比較有把握的。但我們也知道，目前 AI 領域，中國最有價值的投資公司，肯定是深度求索。投資人不會因為說意識到熱點，去改變太多投資邏輯。他會看領域里的方向，投資回報和能看得懂的商業模式。

很多人關心，機器會不會替代人，圖靈獎獲得者楊立昆教授，認為基于現在的 transformer 架構，不可能走向真正的通用人工智能，普通人也不要那么焦慮、緊張。雖然 ai 發展很快，但替代人，目前從技術底層上來說，做不到，沒這個可能性，不要去信很多的那種博流量的言語，純粹是販賣焦慮。

但從工作的角度來說，我們很多人會感到恐懼，會不會被人工智能所替代，這里我的答案非常肯定：yes，而且已經發生、正在發生，有些工種會因為 AI 的出現消失掉，比如客服和接線員，你接電話的那個對方是一個人還是一個人工智能，大部分人已經分不清楚了。

當然，AI 的出現也會創造出大量新的崗位。美國有個非常著名的公司，叫 salesforce，全球排第一的 crm saas 軟件公司，市值大概是3000多億美金，公司的CEO 2024年底宣布2025年不再招聘軟件工程師，為什么呢？因為平臺 agent force 已經提高了30%的工作效率，大部分工作， AI 就能完成。

但需要大量的招聘銷售人員幫他賣agent force ，普通的大眾要相信，如果不用 AI，就好像蒸汽機出現，大馬路上已經有了奔馳車，你還當一個馬車夫，干嘛不學一下開車？AI 帶來的就是智力勞動效率的提升。

我們知道汽車工廠有汽車流水線，牛奶工廠有牛奶流水線。這些流水線核心是機器，人類屬于配套，未來智力流水線如果出現了，工作的人可能就是 AI 的配套。但這并不意味著，人就沒有工作了。還是有人要做汽車設計、規劃、宣傳。

【2】將來大概就是多智能體協同

AI 驅動的決策與之前系統驅動的決策有個不一樣，就是端到端的能力。

什么叫端到端的能力？我舉個例子，2016年， AlphaGo 打敗了李世石之后，人類下棋再也下不過人工智能了。圍棋有361個落點，每個落點的可能性是個天文數字，AI 來做決策，并沒有說規劃、理解，只把圖案和規則告訴它，它就能告訴我們下一步，這就是端到端的能力。

未來通用智能體提供端到端的解決方案才是主流。我認為現在理解意圖，再規劃，再做執行的方案，這是一個經典的人類線性解決問題的方法，反應速度非常慢，而我們大腦解決問題是并發計算的，好多神經元連一塊兒構成了認知體系。現在的智能體應用，靠網絡并行計算，完了還得用線性方法再解釋一遍，再接著處理，這就好比把本來運行得挺高效、像大海一樣的網絡體系，弄成了一條小水溝，效率顯然不高，不經濟，不劃算。

最好的方法是多個大模型協同，一個綜合的大腦決定哪些參數起作用，幾個大模型協同給決策，將來大概就是多智能體協同。一個智能體把一切都搞定、很難，人類都有不同的專業分工，我們根據自己的能力都會有不同的擅長領域，未來的智能體也會如此，這里面就牽扯到多智能體協同，比如標準在哪里、如何定義標準，如何規范。

這是 manus 給我們提出的很重要的問題，一個系統智能的問題，不是單一智能的問題，針對人、機、環境三個環節，如果協同標準只是某一個，比方說純粹的 AI 標準，不考慮人、不考慮環境，大概率不行，將來 AI 應用發展，這個越早確立，會越早地把資源優勢發揮出來。

manus被說套殼，我覺得不是問題，核心問題是用了別人的基礎大模型之后，做了什么？舉個例子，有些人說我做行業大模型，需要另外提供一些數據集，根據我的場景需要，在別人的基礎上再進行訓練，從而調整為比較適合行業場景的大模型。它是一種微調技術，我不知道manus有沒有做。目前公開數據沒有，也沒有宣傳，如果沒有做這件事情，純粹用基模再加上提示詞工程，再加上 python 的開發代碼環境，就完成了工程化，坦率來講，門檻太低。它關于意圖識別任務、規劃、執行的監督、價值觀對齊，如果都只是用提示式工程來做，那大概率稍微復雜一點的任務就會協同不了。

當然，公眾也不要小看 manus干的工作，工程化這件事情很難，有個測試基準GAIA（通用人工智能助手的測試標準），manus 的考試成績不錯，比 OpenAI的operator、 deepresearch要強，說明工程量做得很不錯，至少提示詞、工程技術，其他的小工具做的很好，這里折射出了另外一個創業的機會或者掙錢的機會。你挑一兩個非常熟悉的領域，用現在的 AI 大模型，再加上提示工程和寫代碼的技術，你很可能做出一個非常好用的 AI 助手出來。

有人會問，測試基準的目的是什么？建立一個評測標準來評測 AI 的系統工具，測試智能體的，參與者有 meta。標準比較權威、嚴肅，但僅僅是一個標準而已。大家可以看一下 deepseek v3模型和 r1模型亮出自己考過的標準，你會發現他們的測試集可能有幾十上百個，其中有個很重要的標準GPQA——博士研究生水平的基準測試，deep seek R1 模型考了70多分，人類相關領域的博士平均分數65分。如果不是相關領域的，可能只能拿到30多分，反過來看manus，它能拿出來 PK 的測試集特別少。

這就好比說我們去考試，有一個人說，全世界所有的考卷都來一遍。有人會說我就會一科。作為一個通用agent ，就給人感覺有點單薄。

從全球的角度來說，開源生態比較繁榮的往往都偏技術，不偏應用。比方說linux 開源社區，很厲害的，還有 java 開源社區、app ，這些都偏技術、太偏底層，但一旦到了應用層，往往很少開源。舉個例子，我們說開源的 ERP、開源的辦公協同軟件，開源的 CRM 軟件，這些在整個業界生態的聲音很小。

linux一定是個很重要的主流操作系統之一，大量的人做貢獻， AI 領域大概會遵循同樣的邏輯，如果偏技術，開源會是一個不錯的選擇，如果智能體框架開源，我持保守的態度，智能體偏應用，這種產品閉源能夠走得更遠一點。

開源往往意味著程序員做貢獻。程序員對于業務很多場景不那么了解，甚至不那么在乎，更愿意炫技，說算法多好，問題解決的可復用性、通用性多好、效率多高，這些東西在應用環節里，可能不是最重要的，好的客戶體驗才最重要。

【3】transformer 架構的能力已經壓榨到頂點

AI 最先的哪個地方落地，得看投資回報，哪個地方投資回報最大，落地就最快。現在看，回報排第一的是金融，deepseek 的母公司就是幻方量化，做金融投資的私募股權基金。事實上很多基金公司，很早就大量使用機器學習、人工智能，在大語言模型還沒有出來之前，當初的卷積神經網絡或者說機器學習應用就非常多。

股票就是漲和跌。卷積神經網絡根據大量的數據采集來做預測，預測明天是漲還是跌，第二個領域是生物制藥、醫療。很多 AI 專家，實驗室背后都跟制藥、生物有關系， AI 教母李飛飛在斯坦福的實驗室，就跟很多醫療機構有合作。她是三院院士，有個院士頭銜就跟醫療有關，2024年諾貝爾獎獲得者用deepfolder 發現了蛋白質折疊，本質就是生物醫藥的問題。

一個 agent要能夠很好地完成任務，是挺耗算力的，需要燒很多 token 。我們知道某一個企業部署了一套deepseek，就希望通過它去賣錢，一個月虧了四個多億。他發現這個賬怎么算不明白了，這里意味著好東西是有代價的。

不知道大家有沒有注意到，以前OpenAI每次發布產品，全球轟動，但最近上線了一個產品GPT4.5，熱度實在不高。不如 manus。GPT4以后，transformer 架構的能力可以說已經壓榨到了頂點了，4.5出來之后沒有產生轟動效應、GPT5的難產，說明了一件事情，如果底層架構沒有新的變化，將來后續的版本都不會發生量變，可能是一個微調的概念，不會產生數量級變化。

另外我想多說一兩句，在AI時代，家長對于小孩的培養，首先，填鴨式的應試教育大概率是不行的，如果小孩被教育得沒有童年、沒有樂趣，厭學，您可以停手了，再教育下去這個孩子到高中階段，會突然間一腳踏空，第二，讓年輕人有想象力、有創造力，比他懂什么更重要，哪怕他調皮一點、搗蛋一下，不要去責怪他。乖孩子在 AI 時代，可能就是個沒用的人，當然調皮下不是去危害社會。最后，讓他有一個自己的愛好，有一個自己喜歡的事情，愿意長期干的事情。未來，人類的工作狀態會是什么樣子，我們真的無從知曉，但是我們知道，如果一個人干著他愛的事情，不管是工作還是生活，能夠開心快樂，這也許是一種非常好的生活狀態。

本站是提供個人知識管理的網絡存儲空間，所有內容均由用戶發布，不代表本站觀點。請注意甄別內容中的聯系方式、誘導購買等信息，謹防詐騙。如發現有害或侵權內容，請點擊一鍵舉報。

少妇脱了内裤让我添,久久久久亚洲精品无码网址蜜桃,性色av免费观看,久久人妻av无码中文专区

AI目前在技術底層上難以取代人類