- 發(fā)布時間:2023 -02-03
AIGC是人工智能應(yīng)用的一次重大突破,語義智能將迎來重大發(fā)展。拓爾思認(rèn)為:
萬能的大模型不存在!拓爾思的目標(biāo)不是做最大的模型,而是做專業(yè)的大模型。
數(shù)據(jù)+算法+算力三大核心要素,決定AIGC產(chǎn)出質(zhì)量。拓爾思將以“專業(yè)大模型+領(lǐng)域知識數(shù)據(jù)”為核,努力構(gòu)建起個性化、專業(yè)性的內(nèi)容自動生成壁壘。
技術(shù)+產(chǎn)品+場景的完美結(jié)合,才能實現(xiàn)AIGC推動更多商業(yè)落地進(jìn)程。拓爾思將在類人助手的道路上開拓全新模式,在G+B雙端的需求持續(xù)催化下,優(yōu)化創(chuàng)新對話式AI、智能創(chuàng)作、AIGC搜索引擎等應(yīng)用場景,實現(xiàn)用數(shù)字化勞動力替代枯燥重復(fù)性勞動、擴(kuò)充資源稀缺勞動力、協(xié)助人類完成相應(yīng)任務(wù)和滿足人類情感交流的需求。
10多年前,深度學(xué)習(xí)引發(fā)了人工智能的新浪潮,除了互聯(lián)網(wǎng)大廠外,以智能語音技術(shù)起家的科大訊飛成為人工智能領(lǐng)域的標(biāo)桿性企業(yè)之一。伴隨著ImageNet的標(biāo)志性突破,以四小龍為代表的圖像識別公司也獲得了很多的投資和關(guān)注度,但產(chǎn)業(yè)落地都碰到各種問題,人們開始懷疑人工智能賽道是否要陷入新一輪的低潮。OpenAI的ChatGPT橫空出世,人工智能再次成為人們的關(guān)注熱點,不同的是,這一次的關(guān)注,不僅僅是學(xué)術(shù)界、產(chǎn)業(yè)界和資本界,“跨界”和“出圈”的特征非常明顯。
拓爾思2011年上市的時候,當(dāng)我們試圖給業(yè)界講“非結(jié)構(gòu)化信息智能處理”的概念時,受眾是無感的,最后被貼為更通俗的“大數(shù)據(jù)第一股”的標(biāo)簽。當(dāng)我們在2019年第一次以“語義智能”的大主題給市場表達(dá)我們定位的時候,我們自認(rèn)為把NLP、知識圖譜和圖像音視頻內(nèi)容理解統(tǒng)一到“語義智能旗下,從而定位拓爾思是認(rèn)知智能開拓者,但不是所有的人都能理解和認(rèn)同。但是現(xiàn)在不同了,ChatGPT的流行,很容易給拓爾思的語義智能實現(xiàn)一個新的、輕松的表達(dá)。拓爾思語義智能=AI+NLP。其中AIGC將成為爆發(fā)點,爆發(fā)的不僅僅是技術(shù),或者主要不是技術(shù),而是應(yīng)用的落地和遍地開花。
一、AIGC的發(fā)展現(xiàn)狀
大模型在對話體驗上的突破,讓機(jī)器已經(jīng)能夠近乎完美地理解人類指令,并給出符合預(yù)期答案的時候,人類終于要從感知智能正式邁向認(rèn)知智能了,人類終于可以用“說話”這種方式和計算機(jī)交互,并讓計算機(jī)生成我們需要的內(nèi)容。
未來對話將成為新的UI,我們可以稱之為CUI(Conversation User Interface),這將給全產(chǎn)業(yè)帶來顛覆性的改變,推動世界用工模式的轉(zhuǎn)變,讓勞動力向數(shù)字化轉(zhuǎn)變,讓數(shù)字化勞動力能夠和人類員工完美配合,“人+數(shù)字化勞動力”將成為新的用工模式。2023年將為數(shù)字勞動力元年,ChatGPT的火爆將加速世界勞動力向數(shù)字化轉(zhuǎn)變,踏入認(rèn)知智能的時代。
隨著ChatGPT的火爆,AIGC已經(jīng)受到了全球資本、技術(shù)、產(chǎn)業(yè)和用戶等全維度的關(guān)注。AIGC全稱為AI-Generated Content,指基于大型預(yù)訓(xùn)練模型、生成對抗網(wǎng)絡(luò)GAN等人工智能技術(shù),通過已有數(shù)據(jù)尋找規(guī)律,并通過適當(dāng)?shù)姆夯芰ι上嚓P(guān)內(nèi)容(文字、圖像、音視頻、代碼等)的技術(shù)。
目前AIGC技術(shù)可生成的內(nèi)容形式已經(jīng)拓展到了包括文字、圖像、視頻、語音、代碼、機(jī)器人動作等多種內(nèi)容形式,生成式AI讓機(jī)器開始大規(guī)模涉足知識類和創(chuàng)造性工作,極大推動數(shù)字化內(nèi)容生產(chǎn)與創(chuàng)造。
如:微軟宣布將ChatGPT整合到Office生產(chǎn)力程序套件中,并將通過云服務(wù)提供ChatGPT服務(wù);美國新媒體巨頭Buzzfeed計劃要用ChatGPT來創(chuàng)作內(nèi)容并削減12%的員工導(dǎo)致股價一夜翻倍;ChatGPT與搜索引擎結(jié)合,其內(nèi)容呈現(xiàn)方式也許會導(dǎo)致固化的搜索引擎商業(yè)模式被打破的變革。
二、拓爾思的AIGC商業(yè)實踐
知識圖譜是AIGC利用AI學(xué)習(xí)實現(xiàn)自動生成的基礎(chǔ)之一。早在2015年,拓爾思參與了一項基于大數(shù)據(jù)的類人智能關(guān)鍵技術(shù)與系統(tǒng)的863課題《面向基礎(chǔ)教育的知識能力智能測評與類人答題驗證-高考機(jī)器人》,主要負(fù)責(zé)十億級條目規(guī)模知識圖譜以及大數(shù)據(jù)知識管理和檢索平臺的構(gòu)建,助力該“高考機(jī)器人”能實現(xiàn)對類人答題原型系統(tǒng)的試題理解、常識記憶、語言運用、知識關(guān)聯(lián)、知識推理、初等數(shù)學(xué)求解等各個智力維度進(jìn)行科學(xué)評價。該項目于2017年順利通過驗收。
基于NLP技術(shù)的文本生成可以算作是AIGC中發(fā)展最早的一部分技術(shù)。2016年,拓爾思在浙江日報報業(yè)集團(tuán)的融媒體智能傳播服務(wù)平臺中(簡稱“媒立方”),率先推出了機(jī)器寫作,主要根據(jù)拓爾思的全網(wǎng)資訊大數(shù)據(jù)自動生成體育、氣象和財經(jīng)等領(lǐng)域的主題稿件,推送到浙報媒立方。
2019年,拓爾思提出以“語義智能+行業(yè)/領(lǐng)域”的營銷策略。公司深耕自然語言處理,致力于以數(shù)據(jù)智能應(yīng)用為核心,賦能不同行業(yè)的數(shù)字化轉(zhuǎn)型與降本增效的場景應(yīng)用,并積極與客戶攜手,在AIGC相關(guān)領(lǐng)域,如機(jī)器寫作、對話式AI、內(nèi)容人機(jī)協(xié)同和自動報告生成等應(yīng)用場景已相繼打造出一批優(yōu)秀實踐案例。
三、拓爾思的AIGC發(fā)展路徑
AIGC的興起源自深度學(xué)習(xí)技術(shù)的快速突破和日益增長的數(shù)字內(nèi)容供給需求,市場潛力逐漸顯現(xiàn)。一方面,技術(shù)進(jìn)步驅(qū)動AIGC可用性不斷增強;另一方面,大量需求牽引AIGC應(yīng)用落地。拓爾思認(rèn)為AIGC在數(shù)字化程度高及內(nèi)容需求豐富的領(lǐng)域?qū)⒂袕V闊應(yīng)用空間,個性化及自動化內(nèi)容產(chǎn)出為AIGC產(chǎn)品的核心價值。
1、以“專業(yè)大模型+領(lǐng)域知識數(shù)據(jù)”為核,NLP技術(shù)突破推動更多AIGC商業(yè)落地
拓爾思在AIGC技術(shù)方面有著長期的投入和儲備,這與公司一直專注自然語言處理技術(shù)的研發(fā)和互聯(lián)網(wǎng)大數(shù)據(jù)的積累等優(yōu)勢一脈相承。2022年元宇宙Web3.0的概念為市場熱捧,其中拓爾思為服務(wù)型虛擬數(shù)字人賦能“有趣的靈魂”的能力與產(chǎn)品得到業(yè)界廣泛好評。AIGC是拓爾思數(shù)字人利用NLP與數(shù)據(jù)智能相結(jié)合的重要方向之一,并稱之為虛擬數(shù)字人的“創(chuàng)造力”。
公司將基于通用AIGC大模型,專注優(yōu)勢行業(yè)進(jìn)行專業(yè)大模型的研發(fā),融合學(xué)習(xí)行業(yè)特有的大數(shù)據(jù)和知識,提升大模型對行業(yè)應(yīng)用的適配性。我們將以預(yù)訓(xùn)練大模型、In-Context Learning、instruction tuning等技術(shù)為基礎(chǔ),將文本生成、交互式生成、跨模態(tài)生成、小樣本學(xué)習(xí)、大模型與外部知識庫的融合等功能作為研發(fā)重點,突破基于大模型的AIGC關(guān)鍵技術(shù),在問答式AI、智能創(chuàng)作、搜索引擎等領(lǐng)域?qū)崿F(xiàn)成功應(yīng)用。
2、加快推進(jìn)拓爾思“智創(chuàng)”AIGC平臺的研發(fā)
拓爾思“智創(chuàng)”是一款專注文字生成類的內(nèi)容自動生產(chǎn)平臺,其依托公司長期積累的自然語言處理技術(shù)和人工智能平臺產(chǎn)品為基礎(chǔ),融合開源大模型,將專注在輔助型、應(yīng)用型、創(chuàng)作型等文本內(nèi)容的自動生成研發(fā),以個性化、專業(yè)性的內(nèi)容自動生成為壁壘,保持在AI領(lǐng)域的技術(shù)競爭力。
3、精耕細(xì)分場景,從降本增效走向額外價值轉(zhuǎn)移
結(jié)合拓爾思的優(yōu)勢行業(yè)與客戶群體,公司將優(yōu)先關(guān)注以下行業(yè)的AIGC細(xì)分場景:
新聞出版:機(jī)器人寫稿、內(nèi)容創(chuàng)作協(xié)助、基于媒體大數(shù)據(jù)的自動報告生成(如熱點輿情報告、傳播力報告和榜單生成等)、多模態(tài)的自動配圖(基于文本的圖片、視頻生成)。
政務(wù)服務(wù):公文輔助創(chuàng)作、政民互動服務(wù)(對話式AI的智能問答)、政務(wù)新媒體的創(chuàng)新應(yīng)用(同新聞出版場景應(yīng)用)、政策大腦的摘要/數(shù)據(jù)解讀。
金融領(lǐng)域:自動報告生成(企業(yè)報告、產(chǎn)業(yè)報告等)、證券研報的智能解讀和摘要生成、上市公司的信息檢索。
通用行業(yè):知識圖譜構(gòu)建、人機(jī)協(xié)同的內(nèi)容生成(如水軍回復(fù)、考試答題等)、開源報告的簡報生成等。
元宇宙和云服務(wù):虛擬人服務(wù)(靈魂大腦包羅萬象、主要是虛擬人的“理解力”與“創(chuàng)作力”相結(jié)合,重點是對話式AI、智能創(chuàng)作與虛擬人+物+景的自動生成);數(shù)家資訊云服務(wù)的報告生成、資訊信息精準(zhǔn)對話式檢索;網(wǎng)察云服務(wù)的自動輿情報告生成等。