您當前位置:保定理工學院 >> 信息技術中心 >> 行業(yè)動態(tài) >> 瀏覽文章 |
李星:從DeepSeek看AI賦能教育和科研 【行業(yè)動態(tài)】 加入時間:2025年03月31日 信息來源:本站原創(chuàng) 作者:xjzx 訪問量: |
從技術突破而言,DeepSeek是很優(yōu)秀的大模型,對于AI for Science和AI的個人化是巨大的促進,DeepSeek能獲得這樣的成果很了不起。過去,人類文明漫漫數(shù)千年,技術的進步以十年甚至是百年計算。而在我們的一生中,能夠見證互聯(lián)網(wǎng)和人工智能改變世界這樣的大時代,何其有幸。未來不可知,只能勇敢前行,我們不預測未來,我們創(chuàng)造未來。 一蒂雙果:互聯(lián)網(wǎng)與人工智能
在人類的文明發(fā)展歷程中,漫漫數(shù)千年,技術的進步以十年甚至是百年計算。然而,五十多年前,互聯(lián)網(wǎng)誕生并開始蓬勃發(fā)展;當下,人工智能技術一日千里,DeepSeek的出現(xiàn)更是令人驚喜。我們在一生之中趕上了互聯(lián)網(wǎng)和人工智能,是這個大時代的見證者,這是非常幸運的。
互聯(lián)網(wǎng)和人工智能都稱得上是人類社會最重要的發(fā)明,它們就像一粒種子所結出的兩顆甜美的果實——據(jù)RFC 1的作者史蒂夫·克羅克(Steve Crocker)的說法,美國軍方ARPA最初的計劃是研究人工智能,卻一不小心先做出了ARPANET。
1943年,在信息革命剛剛開始的時候,IBM董事長托馬斯·沃森(Thomas J. Watson)曾經(jīng)預測:未來,5臺主機足以滿足整個世界市場。然而,當時間來到2024年,全球預計有接近13億個人計算機,70億部手機,180億接入互聯(lián)網(wǎng)的loT設備,以及2000億正在運行的CPU。
觀察硅谷近二十年發(fā)展的趨勢圖,我們能夠發(fā)現(xiàn)一些有趣的事實。2004年3月,硅谷最炙手可熱的行業(yè)是通訊,如AT&T的貝爾實驗室是代表。時間來到2014年4月,硅谷最火熱的行業(yè)是智能手機。而在2024年的9月,AI毫無爭議地成為了世界關注的焦點。
在歷屆諾貝爾獎中,有幾次獲獎與信息技術IT相關。1979年的諾貝爾生物或醫(yī)學獎頒發(fā)給了發(fā)明CT成像的兩位科學家。2009年,光纖通信之父高琨獲得了諾貝爾物理學獎。2024年的諾貝爾物理學獎和化學獎都與人工智能有關,引發(fā)了人們的熱議:物理學獎表彰了基于人工神經(jīng)網(wǎng)絡實現(xiàn)機器學習的基礎性發(fā)現(xiàn)和發(fā)明,諾貝爾化學獎則表彰了對蛋白質神奇結構密碼的破解。
隨著人工智能的發(fā)展,人類文明最終將走向何方?我們不得而知。在2014年出版的原著《我們最后的發(fā)明:人工智能與人類時代的終結》(Our Final Invention)一書中,作者探討了不顧一切追求先進的AI技術的危險。書中指出:一群倔強的AI制造者達成了一致——任何情況下都不得把超級AI接入網(wǎng)絡。他們擔心,一旦AI達到人類水平,它將擁有與人類一樣的生存動力。人類可能會被迫與比想象中更狡猾、更強大、更陌生的對手競爭。
然而如今,人工智能不僅接入了互聯(lián)網(wǎng),還窮盡了互聯(lián)網(wǎng)上的所有語料進行訓練。這個春節(jié),繼ChatGPT出現(xiàn)之后,DeepSeek這匹最大的黑馬殺出了重圍。正所謂有心栽花花不開,無心插柳柳成蔭。這再次印證了“偉大無法被計劃”這一觀點。偉大并不是目標指引的結果,很多時候快反而就是慢——沒有特殊目標,每次只是選擇下一塊踏腳石,反而能柳暗花明。
對DeepSeek的評價
2025年剛開年,DeepSeek的強推理模型就讓大模型領域再次迎來了“ChatGPT”時刻。DeepSeek用算法在一定程度上突破了算力“瓶頸”的限制。
其實在DeepSeek大熱之前,我已經(jīng)下載并使用了它的前幾個版本。從DeepSeek-llm,到v2、v2.5,在當時,我感覺它并不出彩。DeepSeek真正火了起來,是從v3和R1開始。同時它還做了coder和coder-v2,在R1之后還出了一個多模態(tài)版Janus。在我看來,Janus與我用的其他開源識圖和文本到圖像的開源模型還有差距,但其真正出彩的地方在于,多模態(tài)的圖像識別和圖像生成是用同一個模型。
DeepSeek用戶過億只用了7天,隨后達到了1.25億注冊用戶。ChatGPT達到1億用戶,花了2個月。對比之下,DeepSeek的增長速度是ChatGPT的數(shù)倍。
DeepSeek能獲得這樣的成果很了不起。首先是因為,我們能發(fā)現(xiàn),DeepSeek是很優(yōu)秀的大模型,它的水平對全球AI界震動很大。其二,DeepSeek是開源模型,可免費下載、本地使用,能保護用戶的隱私。其三,DeepSeek發(fā)表了質量較好的學術論文。其四,DeepSeek確實有不少技術創(chuàng)新。
然而,DeepSeek也引起一些爭議。如訓練數(shù)據(jù)可能用到了OpenAI商業(yè)條款禁止的內(nèi)容(但OpenAI本身互聯(lián)網(wǎng)上數(shù)據(jù)的來源也被人質疑)。其次,它做了某種形式的“對齊”,導致一些回答不夠客觀。最后,其算力資源使用效率的計算方法等方面存在著爭議。
其實,DeepSeek并非傳統(tǒng)意義上的AI公司,它不看短期直接收益、聘用年輕的名校高材生,公司的價值觀重視好奇心和創(chuàng)造欲。可以說,DeepSeek的成功故事對世人有著重要的參考價值。在DeepSeek創(chuàng)始人梁文鋒的采訪中,他提到,創(chuàng)新不完全是商業(yè)驅動的,還需要好奇心和創(chuàng)造欲,這里的好奇心,是對AI能力邊界的好奇。在這樣鼓勵創(chuàng)新的環(huán)境之下,再加上一群非常聰明、充滿好奇心的人,創(chuàng)造出奇跡也就不足為奇了。
DeepSeek的勝利其實是開源對閉源的勝利。Meta的首席人工智能科學家楊立昆(Yann Lecun)認為,DeepSeek的成功帶來的最大啟示是保持AI模型開源的重要性。
此外,DeepSeek的開源(其實是開放模型權重)對于AI for Science和AI的個人化是巨大的促進。我認為,世界上通用的大模型不需要很多,而有個性的大模型更有用。因此個人化和本地化對于使用AI的人而言是非常重要的。對此有興趣且條件允許的人們,建議在本地安裝使用,若能部署滿血版最好,退而求其次,蒸餾版也不錯。與DeepSeek-R1的對話是很有啟發(fā)意義的,有時它能提出自己未必能想到的觀點。
然而,DeepSeek也存在著一些不容忽視的問題,需要引起人們的重視。其一,本地部署基于ollama等本地推理工具,有潛在的網(wǎng)絡安全風險。其二,與其他大模型一樣,DeepSeek的答案也存在幻覺,內(nèi)容的可信度存疑。其三,與所有大模型一樣,DeepSeek也面臨著非常激烈的國內(nèi)和國際競爭,未必能一直保持開源大模型的領先地位。其四,DeepSeek的對齊存在著爭議。其五,現(xiàn)實世界中用于訓練AI的已有開放數(shù)據(jù)接近耗盡,當然這也是所有大模型所面臨的問題。
技術的發(fā)展一日千里。前幾日,埃隆·馬斯克(Elon Musk)旗下的人工智能公司xAI發(fā)布了Grok3,稱其在數(shù)學、科學和編碼基準測試中擊敗了Google Gemini、DeepSeek v3、Claude和GPT-4o。暫且不論Grok3的實際水平,馬斯克的話很有意思:“要想知道一家公司能否在技術競賽中勝出,就看它的創(chuàng)新速度和創(chuàng)新的加速度是否足夠快”。DeepSeek若要持續(xù)保持領先地位,還需要不斷地創(chuàng)新。
開源帶來的機遇
總結人類歷史上三個最重要的時刻,我認為是語言的誕生、文字的誕生以及生成式AI的誕生。語言的誕生將人與動物區(qū)別開來,人類可以用系統(tǒng)思維來思考事物、進行交流。而文字的誕生推動了人類文明的發(fā)展。生成式AI誕生之后,會使用AI的人與不會使用AI的人,就是知識分子與文盲的區(qū)別了。
AI是工具的革命,同時也是革命的工具。對于互聯(lián)網(wǎng)體系結構研究而言,其每一層都可以使用AI來提高網(wǎng)絡、路由、域名等方面的性能和安全性。除此之外,傳統(tǒng)的網(wǎng)絡分層模型的應用層上方是使用應用程序的人,現(xiàn)在可以在應用層和人之間加上一個“人工智能層”。
而人工智能對高等教育的影響,不亞于十二世紀現(xiàn)代大學的誕生。隨著現(xiàn)代大學的誕生和十五世紀印刷術的發(fā)明,帶來了教育和知識的平民化浪潮;隨著互聯(lián)網(wǎng)的發(fā)展和開放源碼,人們可以自己開發(fā)APP了;而如今,DeepSeek、Llama這些模型開源之后,只需要一臺性能好的設備,完全就可以自己調優(yōu)、嵌入本地知識,蒸餾了——人們將自己的專業(yè)知識和領悟與大模型共享共生,由此誕生各種各樣的Agent,這將改變世界。
從大時代的角度來思考,教育和科研將會發(fā)生顛覆性的巨變,究竟如何變,我們還不得而知。舉個例子,在AI時代,我們不能再用現(xiàn)在做科研的思路生搬硬套了。AI生產(chǎn)論文的速度非常快,質量越來越好,如果還要求論文必須是人類自己寫,AI寫就被視為學術不端,人類寫的論文質量將遠低于AI生成的論文,這將帶來問題。由此看來,教育的評價體系都會發(fā)生巨變。
在AI的加持之下,人類的學習曲線也將會發(fā)生改變。傳統(tǒng)的學習曲線是S形,初期進步緩慢,之后快速提升,最后趨于平緩。而在使用AI Agent之后,人類的學習效率將大幅提升,甚至有些技能都能省略不學了。從前,我讀阿西莫夫的《基地》,數(shù)學家哈里·謝頓要編寫百科全書,將知識都存儲下來,保存人類文明的火種。在銀河帝國后期,科技高度復雜化,但社會整體對科學原理的理解逐漸喪失。從前我不太理解這一點,當下,書中的這些內(nèi)容就完全可理解了——我們現(xiàn)在的很多技能將來都不再需要,真的會失傳。
近期,有文章還提出了 “人機共讀計劃”,通過人類與機器協(xié)作,生成高質量的預料,不僅可以解決大模型消耗大量語料后資源枯竭的問題,還能通過人類與機器的深度協(xié)作創(chuàng)造出更多樣化的內(nèi)容。人類每天都會接觸新的知識和信息,將它們“喂”給大模型,大模型再給出反饋,人機交互,互相促進。
然而,這隨之而來也帶來了問題:究竟是給每個人配備一臺計算機,還是給每臺計算機配備一個人?當人工智能變得越來越聰明的時候,人類與技術之間的關系,是否已經(jīng)發(fā)生了反轉?這也是值得我們思考的問題。
2024年,我曾說,30年前我們的夢想是讓中國的每一個學生能夠使用自己的計算機連上互聯(lián)網(wǎng),而今天,我們的希望是讓中國的每一個學生能夠使用自己的大模型聯(lián)網(wǎng)互相交流,走向充滿希望的未來。如今看來,DeepSeek V3/R1開源大模型發(fā)布之后,這一暢想完全可以成為現(xiàn)實。
在不久的將來,每個孩子都將有一個自己的大模型,將孩子新學的知識與大模型交互,促進孩子的思維廣度與深度的提升。大模型與孩子可以共同成長,提醒孩子哪些方面要加以重視,提醒他哪些方面不要再犯同樣的錯誤。
也許,未來的教育是這樣的圖景:在童年,進行有意義的玩耍,在玩耍過程中學習到多個領域的知識,全面地了解這個世界。青少年,保持著熱情去探索人生的目標,確定他們真正擅長和喜歡的事,以此作為事業(yè)。成年,在既定的方向上、真正想做的事情上努力耕耘。
偉大不能被計劃,計劃的事物未必會按照既定的路線發(fā)展。在五十多年前,互聯(lián)網(wǎng)剛誕生的時候,誰能想到會發(fā)展出視頻直播呢?未來不可知,只能勇敢前行,我們不預測未來,我們創(chuàng)造未來。
本文根據(jù)清華大學李星教授采訪整理 整理:陳茜 |