欧美色图 亚洲|野外口爆视频国产|久久精品视频观看|97精品人人抽插

王小川:搜狗以語言為核心的人工智能布局

2018-01-25 09:51:10 來源:億歐 熱度:

搜狗有兩大核心產(chǎn)品:搜狗搜索和搜狗輸入法。搜狗搜索是中國第二大搜索引擎,搜索份額占17.8%,也是全球第三大搜索引擎。同時搜狗搜索也在非常快地增長,最近三年在移動端搜索流量上漲470%。

搜狗輸入法是全球最大的輸入法,每年有超過900億次中文輸入次數(shù),是手機第三大應用,僅次于微信和QQ,過去三年移動端日活用戶增長136%。

1月24日下午,2018搜狗合作伙伴大會在北京國貿(mào)大酒店舉行。搜狗CEO王小川難掩內(nèi)心之愉悅與輕松。因為就在一個多月前(確切地說是2017年11月9日),搜狗成功登陸紐交所,首日市值53億美元。

王小川介紹,AI開始使得搜狗搜索和輸入法更上一個臺階,搜狗要打造以語言為核心的人工智能布局。本次會議,王小川還發(fā)布兩大AI產(chǎn)品:搜狗旅行翻譯寶和搜狗速記翻譯筆。

以語言為核心的人工智能布局

搜狗以語言為核心,分成兩個層面。一方面叫做自然交互,即語音識別、語音合成,還有圖像識別和合成;另一方面是知識計算,比如問答技術、翻譯技術。這些技術在搜狗里面進行落地,并且開放給一些合作伙伴共建這樣生態(tài)。

具體而言,搜狗的AI布局可以分為五個方面:聽覺、視覺、對話、問答、翻譯。

1、聽覺

包括語音識別、語音合成、聲紋識別。王小川介紹,搜狗語音識別是全球最大在線語音識別提供商,每天有三億次語音識別請求,服務量數(shù)據(jù)巨大,輸入法也有豐富的場景。

除語音識別以外,搜狗也會做語音合成技術,在語音合成當中也有個性化能力,還提供核心的情感遷移技術。

2、視覺

包括OCR/識圖、唇語識別和狗臉識別。圖像識別和合成也是和語言相關的能力,第一方面就是OCR,搜狗每天有超過兩百萬次OCR請求,搜狗提供語音輸入、輸入鍵盤和OCR,只要一拍一掃描,就能用文字高速識別和輸入。

唇語識別即將語音和圖像結合,去年在烏鎮(zhèn)世界互聯(lián)網(wǎng)大會上搜狗發(fā)布了唇語識別系統(tǒng),這套系統(tǒng)通過圖像,不需要麥克風,只需要攝像頭打在你的嘴上,通過后面圖像模型和后面語言模型獲得所有內(nèi)容。今天唇語識別能力大大超越超過人。

跟圖像更多有關系的地方,是定向的個性優(yōu)化,做狗臉識別,給你愛犬拍照,系統(tǒng)會精確告訴你是什么狗,搜狗會把這個技術放在搜索引擎里面去提供能力。

3、 問答、對話

王小川說:“在過去十年中我們做了很多,包括問答技術、對話技術,不斷跟我們搜索引擎和輸入法進行結合。”

輸入法會走向對話,IPO那會兒,他每天一起床就有上千條微信發(fā)過來,如果輸入法能夠根據(jù)上下文,以個性化方式生成有自己特色的回答,讓人選擇,會非常有幫助。

經(jīng)過高考人都知道,我們做填空題比選擇題難度更大,選擇題讓你選輕松很多,輸入法其中一個路徑是把這樣一個讓大家輸入的填空題,變成了選擇題。

4、翻譯

王小川表示,翻譯技術走向實用化不亞于人類發(fā)明電,同樣是歷史突破,今天各個國家沖突,各個之間不信任是因為語言和文化引起,一旦翻譯技術被解決掉,我們可以很容易獲得全球信息,國外人也知道我們的內(nèi)容,世界會發(fā)生變化。

搜狗的使命是讓表達和獲取信息更簡單,有了翻譯技術之后有了新的更大的進展,實現(xiàn)讓跨國表達和獲取信息變得更簡單。

發(fā)布兩大AI產(chǎn)品:搜狗旅行翻譯寶和搜狗速記翻譯筆

目前市場上的AI翻譯產(chǎn)品大部分是云端翻譯,難以解決上網(wǎng)要漫游費和網(wǎng)絡不穩(wěn)定的問題。搜狗旅行翻譯寶、搜狗速記翻譯筆結合了神經(jīng)網(wǎng)絡機器翻譯、語音識別、麥克風陣列、圖像識別等多項技術。

王小川說,搜狗有自己的離線翻譯技術,而且使得這樣一個技術在終端設備里面執(zhí)行,在離線模式下壓縮,使離線模型壓縮是在線模型的五分之一,在手機或者其它終端里面,壓縮程度為三十五分之一。這樣儲存問題和識別得到解決,模型精度接近無損,并且實時響應,這也是業(yè)界領先的神經(jīng)網(wǎng)絡壓縮技術。

搜狗旅行翻譯寶主要解決了出境旅游時翻譯APP存在的“網(wǎng)絡不好”與“翻譯不準”兩大痛點,支持文本翻譯、對話翻譯、語音翻譯、實景翻譯等多種翻譯模式,中英離線翻譯能力讓用戶在未聯(lián)網(wǎng)時也能使用。

在離線圖像識別里面,要求服務器在沒有網(wǎng)絡情況下也可以工作,而且要解決很多實景問題,比如在拍路牌和菜單的時候,圖片里面會有復雜背景,有光線問題,圖片還可能扭曲有弧度,搜狗是先在翻譯APP里面做嘗試,進行數(shù)據(jù)優(yōu)化,然后放在離線翻譯機里面。

翻譯筆則針對了外語學習場景,同傳語音翻譯實現(xiàn)實時對話,即說即翻的功能。兩款產(chǎn)品均搭配了雙麥克風陣列降噪,讓語音識別與翻譯更準確,同時提供英日韓俄德等17種翻譯語言,覆蓋主要出游國家。目前,搜狗旅行翻譯寶定價為1498元,搜狗速記翻譯筆定價299元,將于3月12日在京東首發(fā)。

責任編輯:周帥潔

相關推薦

搜狗第二季度實現(xiàn)營收3000萬美元

在新媒體行業(yè),企業(yè)廣告投放吸引力一直被認為是貨幣化能力的一個主要標志。艾瑞咨詢最新數(shù)據(jù)顯示,截至2012年6月30日,搜狗總用戶數(shù)為3.7億,已成為中國第四大互聯(lián)網(wǎng)公司。用戶數(shù)的持續(xù)增加帶來廣告單位點擊單價穩(wěn)固增長。在過去八個季度,搜狗收入的復合增長率為24%,是中國前10大互聯(lián)網(wǎng)廣告服務提供商中,增長最快的,排名也從兩年前的第12名上升到第8名。搜狗公司7日發(fā)布的2012年第二季度財報顯示,該季度搜狗實現(xiàn)營收3000萬美元,較2011年同期增長123%,較上一季度增長34%。搜狗首席執(zhí)行官王小川表示,憑借雄厚用戶量、技術創(chuàng)新DNA和“云-端模式”戰(zhàn)略優(yōu)勢,搜狗將繼續(xù)保持強勁的發(fā)展勢頭。201