“盡管美國占據主導地位,但亞洲制造的人工智能競賽正在升溫。”日本《日經亞洲評論》24日以此為題報道稱,中國、越南、日本等國家正加入亞洲人工智能(AI)競賽,根據各國的本土語言和文化開發生成式人工智能大模型,以擺脫對美國科技公司研發的人工智能的依賴。
2023年11月23日,杭州,觀眾在2023第二屆全球數字貿易博覽會上參觀。
越南加入人工智能競賽
因為擁有豐富的資金和人才,OpenAI、谷歌和亞馬遜等美國科技公司在全球生成式人工智能市場中目前處于領先地位。《日經亞洲評論》報道稱,這致使全球許多公司都在使用美國開發的人工智能產品。許多正在研發的生成式人工智能大模型都是在英語語料上進行訓練的,因為其他語言的數據相對較少,導致在回答涉及其他國家文化、歷史和法律的問題時,美國的人工智能模型回答得沒有那么準確。
越南通信傳媒部近日發布了一項計劃——到2025年,越南至少擁有一個越南語大語言模型。越通社報道稱,OpenAI推出的ChatGPT開啟了各國科技公司之間征服生成式人工智能的競賽。在此背景下,越南也推出了多款生成式人工智能產品。
其中,第一個向公眾開放的越南生成式人工智能大模型ViGPT,在糾正了那些故意設置的虛假陳述后,引起了不小的轟動。ViGPT由越南企業Vingroup旗下子公司VinBigData開發,通過越南語與用戶互動。一位美國耶魯大學教授評價這款人工智能產品稱,ViGPT使用越南數據來訓練,在對該國問題的回答上,精確度要高于外國競爭對手。
VinBigdata科學總監武河文表示,越南版ChatGPT的上線體現出越南優秀的人工智能技術。這也將助力越南減少對外國產品的依賴,避免提供關于越南歷史、文化和政治的虛假信息,同時最大限度地減少數據信息流向國外。
42%的增長速度!
彭博社報道稱,全球生成式人工智能市場正以每年42%的速度擴張。預計到2032年,市場規模將達到1.3萬億美元,約為2022年400億美元規模的32倍。據估計,全球只有約5%的人口將英語作為第一語言,這意味著非英語人工智能大模型潛在需求巨大。
新加坡上個月宣布了一項計劃,將針對印尼語、馬來語和泰語研發大語言模型。
日本公司也一直在開發日語生成式人工智能。《日經亞洲評論》報道稱,日本電氣公司去年推出了cotomi大語言模型,日本電報電話公司將于3月份推出基于人工智能大模型Tsuzumi的服務,兩個大模型都在日語語境下表現出很高的準確性。
媒體報道稱,日本政府聯合日本電氣公司、富士通、軟銀等大型科技公司投入數億美元,開發日語大型語言模型。軟銀公司首席執行官宮川潤一表示,大型語言模型如果了解日本的商業習慣,在可用性方面將更具優勢,比如說能以更自然的語言完成電子郵件回復等工作。
去年8月,韓國網絡服務公司NAVER推出了為韓語定制的生成式人工智能HyperClova X。HyperClova X將集成到該公司的搜索引擎和線上購物平臺上去,幫助用戶更高效地找到他們想要的東西。NAVER稱,這款人工智能大模型的韓語數據庫比ChatGPT的韓語數據庫大6500倍,因此可以更自然地生成文本,更流暢地識別語言。
“人工智能技術不應該依賴外國公司”
浙江大學國際聯合商學院數字經濟與金融創新研究中心聯席主任、研究員盤和林表示,各國由于語言不同,其人工智能模型生成的文本也不一樣。如果大語言模型是生產力工具,這個生產力工具自然需要適合本國老百姓的需求。有些國家的語言文化背景更為相似,比如西歐國家和美國,很多時候只需要直接翻譯、組織語言即可,但中國是象形字,語言語境完全不同,如果你用英語人工智能大模型給出回答再翻譯,往往會有濃重的翻譯腔,這種翻譯痕跡在國產大模型上就不會出現。
《日經亞洲評論》分析稱,各國都意識到過于依賴美國技術的風險,都在積極展開本土化人工智能研發。有人擔心,使用另一個國家開發的人工智能程序會導致敏感信息數據泄露。武河文表示,人工智能技術不應該依賴外國公司。隨著學生們越來越多地使用人工智能來學習,人工智能技術輸出的內容可能會對年輕一代產生巨大的影響。
盤和林表示,人工智能本身只是一個工具,是在模仿人類行為。人工智能大模型背后是數據訓練,而不是數據庫。我們之所以要用中國的人工智能,并不僅僅是因為擔心其他國家的價值觀輸入,也是因為中國人的文化和語境等各方面都不同,如果我們使用其他國家的人工智能,可能會導致一系列使用不方便的問題。在此基礎上,中國人工智能大模型如果能融入全世界,就能給中文使用群體提高生產力,同時也能提高中國內容、精神產品的生產力水平。
(來源:環球時報)