微軟、谷歌和當地新創都要搶印度AI市場 先學會印度多種語言再說
【編譯黃惠瑜/綜合外電】美國人工智慧(AI)巨擘微軟(Microsoft)、谷歌(Google)和印度當地AI新創公司,正努力研發可以學會印度當地各種語言的聊天機器人,除了利用印度的多語言特性測試新的AI技術,也藉機發展輝達(Nvidia)執行長黃仁勳近期大力推動的「主權AI」技術,但更重要的,是在AI市場上率先搶下這塊世上人口最多的大餅。
英國《金融時報》今日(6/24)報導,全球科技公司與印度當地AI公司正努力開發AI語音助理和聊天機器人,可以使用印地語(Hindi)和坦米爾語(Tamil)等印度當地語言。這些以印度各種語言來開發AI的公司包括微軟、谷歌、加州矽谷資助的當地AI新創公司Sarvam AI,以及印度電動二輪車新創龍頭Ola Electric旗下的Krutrim公司。每一個競爭者都希望搶下這塊人口最多的市場,並藉此測試新開發的AI技術,甚至作為開發「主權AI」(sovereign AI)的試金石。
印度有22種官方語言,其中印地語最普及。但根據統計,全國14億人口使用的語言和方言高達數千種。谷歌上週二(6/18)推出的Gemini AI助理只會9種印度的語言。
微軟的Copilot AI助理有12種印度語言版本,並持續為印度量身定做其他項目,包括建立「微型」語言模型。比起以大型語言模型為基礎所建構的生成式AI,這些微型語言模型比較便宜,因為可以在智慧型手機而非雲端上使用,也可能更適合像印度這類網路受限的國家。
微軟的印度暨南亞區總裁昌多克(Puneet Chandok)向《金融時報》表示,微軟希望「讓(AI)變得簡單且容易使用 」。他也補充,要達成這個目標,需要將AI置於印度文化背景中,才能讓AI更具相關性與準確性。
印度Lightspeed公司合夥人莫哈帕特拉(Hemant Mohapatra)表示,隨著各國政府尋求在國內訓練並儲存自身發展的「主權AI」,投資當地的AI公司變得越來越重要。他說,「如果你要在印度使用印度公民的資料、聲音、影片、文字、不同語言等來訓練基礎模型,那麼它就必須是一家印度公司」。
主權AI是什麼?
「主權AI」是指一個國家利用自身的基礎設施、資料、勞動力和企業網絡生產AI的能力。按照輝達執行長黃仁勳的說法,自己國家獨特的文化或語言等資料應由自己擁有並守護,並以本國創造的AI產出對國內有價值的成果,而非進口他人或他國利用本國資料創造的AI。
全球目前有多少種人類語言?最夯的ChatGPT會幾種?
根據「民族語言網」(Ethnologue)統計,全球約有7164種人類語言。ChatGPT目前支援的語言逾80種。