英國牛津2022年3月30日 /美通社/ -- 全球領(lǐng)先的集成量子計(jì)算公司Quantinuum的量子自然語言處理團(tuán)隊(duì)發(fā)布了其開源Python庫和工具包λambeq(讀音“Lambek”)的重大更新。
λambeq能將任何自然語言句子轉(zhuǎn)換為量子電路,可在量子計(jì)算機(jī)上得到識(shí)別。該新版本專門面向量子自然語言處理(QNLP)和自然語言處理(NLP)領(lǐng)域不斷擴(kuò)大的研究人員、開發(fā)人員和用戶社區(qū)設(shè)計(jì)而成。未來五年,自然語言處理市場(chǎng)預(yù)計(jì)將每年增長27%。[1]
此次更新將支持QNLP的發(fā)展和未來的潛在應(yīng)用,如自動(dòng)對(duì)話、文本挖掘、語言翻譯、文本向語音的轉(zhuǎn)換、語言生成和生物信息學(xué)。
Quantinuum應(yīng)用量子NLP研究主管 Dimitrios Kartsaklis博士表示:“自我們推出λambeq以來,我們收到了快速增長的用戶社區(qū)的寶貴反饋,目前可用的新功能就反映了這一點(diǎn)。例如,λambeq的新版本現(xiàn)在帶一款最先進(jìn)的原生解析器,已完全集成到工具包中。此外,該工具包現(xiàn)在配備了一個(gè)支持PyTorch等受歡迎的受監(jiān)管學(xué)習(xí)庫的培訓(xùn)包,以幫助用戶使用λambeq生成的量子電路和張量網(wǎng)絡(luò)來高效地培訓(xùn)NLP任務(wù)。本次更新的所有內(nèi)容都是為了提高可訪問性,至關(guān)重要的是,它縮短了取得成果所需的時(shí)間?!?/p>
此外,重要的是,λambeq基于神經(jīng)的新CCG解析器Bobcat通過一個(gè)大量經(jīng)人類注釋的句法派生語料庫進(jìn)行了培訓(xùn)。它與該工具包完全集成,簡(jiǎn)化了安裝過程,并具有更好的先進(jìn)解析性能。此前的解析器仍將保留在工具包中,出于社區(qū)的利益,Bobcat也將在適當(dāng)時(shí)候作為單獨(dú)的獨(dú)立開源工具進(jìn)行發(fā)布。
此次更新配備了一個(gè)命令行界面,讓沒有編程知識(shí)的用戶也能夠使用該工具包的大部分功能。此次更新還包含一個(gè)受到監(jiān)控的新培訓(xùn)模塊,旨在簡(jiǎn)化機(jī)器學(xué)習(xí)設(shè)置中的對(duì)參數(shù)化量子電路和張量網(wǎng)絡(luò)的培訓(xùn)過程。
λambeq是首款量子NLP和計(jì)算語言工具包。它可以將句子轉(zhuǎn)換為量子電路,并從句子的句法結(jié)構(gòu)中繼承其糾纏結(jié)構(gòu)。這一構(gòu)造的基礎(chǔ)是語法數(shù)學(xué)模型和量子協(xié)議數(shù)學(xué)模型之間的規(guī)范數(shù)學(xué)關(guān)聯(lián),由Quantinuum的高級(jí)研究人員、首席科學(xué)家 Bob Coecke教授和人工智能主管 Stephen Clark教授發(fā)現(xiàn)。
通過此次更新,λambeq將變得更加靈活,可為用戶提供更多生成量子電路的選項(xiàng)。它支持對(duì)語法圖進(jìn)行修改,同時(shí)可簡(jiǎn)化根據(jù)句法結(jié)構(gòu)確定量子電路的復(fù)雜性。
λambeq輸出的可視化也得到了改善,記錄功能已通過眾多實(shí)例得到擴(kuò)展,以消除普通用戶的入門障礙。
在哪里獲取λambeq
[1] 《Mordor Intelligence》,2021年:https://www.mordorintelligence.com/industry-reports/natural-language-processing-market