百度Familia 開(kāi)源項(xiàng)目包含文檔主題推斷工具、語(yǔ)義匹配計(jì)算工具以及基于工業(yè)級(jí)語(yǔ)料訓(xùn)練的三種主題模型:Latent Dirichlet Allocation(LDA)、SentenceLDA 和Topical Word Embedding(TWE)。 支持用戶以“拿來(lái)即用”的方式進(jìn)行文本分類、文本聚類、個(gè)性化推薦等多種場(chǎng)景的調(diào)研和應(yīng)用。考慮到主題模型訓(xùn)練成本較高以及開(kāi)源主題模型資源有限的現(xiàn)狀,我們會(huì)陸續(xù)開(kāi)放基于工業(yè)級(jí)語(yǔ)料訓(xùn)練的多個(gè)垂直領(lǐng)域的主題模型,以及這些模型在工業(yè)界的典型應(yīng)用方式,助力主題模型技術(shù)的科研和落地。
原文網(wǎng)址:https://github.com/baidu/Familia
原文網(wǎng)址:https://github.com/baidu/Familia
下一篇:谷歌自動(dòng)駕駛卡車已在上路測(cè)試 網(wǎng)友看到了它真實(shí)的樣子上一篇:百度人臉識(shí)別技術(shù)落地河南南陽(yáng)機(jī)場(chǎng) 支持旅客刷臉登機(jī)
責(zé)任編輯:黃焱林