“l(fā)ambeq”將句子轉(zhuǎn)換為量子電路,隨著量子計算系統(tǒng)的擴(kuò)大,加速實用QNLP應(yīng)用的開發(fā)
英格蘭劍橋2021年10月14日 /美通社/ -- 劍橋量子(“CQ”)今天宣布推出全球首個量子自然語言處理(QNLP)工具包和文庫。該工具包被稱為lambeq,以已故數(shù)學(xué)家和語言學(xué)家Joachim Lambek的名字命名。
lambeq是全球首個QNLP軟件工具包,能夠?qū)⒕渥愚D(zhuǎn)換為量子電路。其目的是加快開發(fā)實用、現(xiàn)實世界的QNLP應(yīng)用程序,如自動對話、文本挖掘、語言翻譯、文字到語音、語言生成和生物信息學(xué)。
lambeq在完全開源的基礎(chǔ)上推出,以造福全球量子計算界和快速發(fā)展的量子計算研究人員、開發(fā)人員和用戶生態(tài)系統(tǒng)。lambeq與CQ全球領(lǐng)先和快速增長的量子軟件開發(fā)平臺TKET無縫銜接,后者也是完全開源的。這使QNLP開發(fā)人員能夠訪問盡可能廣泛的量子計算機(jī)。
lambeq由首席科學(xué)家Bob Coecke領(lǐng)導(dǎo)的CQ位于牛津的量子計算研究團(tuán)隊構(gòu)思、設(shè)計和打造而成,由資深科學(xué)家Dimitrios Kartsaklis博士擔(dān)任平臺的首席架構(gòu)師。lambeq和范圍更廣的QNLP是一個為期十多年的研究項目的結(jié)果。
Coecke表示:“我們的團(tuán)隊一直在參與基礎(chǔ)性工作,探索如何利用量子計算機(jī)解決人工智能中一些最棘手的問題。這項工作的基礎(chǔ)是最初由我本人、現(xiàn)任CQ人工智能主管Steve Clark等人開創(chuàng)的進(jìn)步結(jié)果。NLP是這些調(diào)查的核心。幾個月前的發(fā)布詳細(xì)介紹了CQ首次在實際量子計算機(jī)上實施QNLP的情況,以及我們在2019年12月首次披露了相關(guān)基本原則,現(xiàn)在lambeq的推出是自然邁出的下一步?!?/p>
Coecke補(bǔ)充道:“在過去一年中發(fā)表的各種論文中,我們不僅提供了量子計算機(jī)可以如何增強(qiáng)NLP的詳細(xì)信息,而且還證明了QNLP是“量子原生”,這意味著管理語言的組織結(jié)構(gòu)在數(shù)學(xué)上與管理量子系統(tǒng)的結(jié)構(gòu)是相同的。這將引領(lǐng)世界最終擯棄目前人工智能所依賴的不透明和近似性的蠻力技術(shù)模式?!?/p>
lambeq使CQ科學(xué)家先前描述的組成分布(DisCo)類型NLP實驗的設(shè)計和部署得以完成并實現(xiàn)自動化。這意味著從編碼文本結(jié)構(gòu)的句法/語法圖表到采用TKET實施的(古典)張量網(wǎng)絡(luò)或量子電路,可針對文本分類等機(jī)器學(xué)習(xí)任務(wù)進(jìn)行優(yōu)化。lambeq采用模塊化設(shè)計,用戶可以在模型內(nèi)外交換組件,并在架構(gòu)設(shè)計中具有靈活性。
lambeq消除了專注于人工智能和人機(jī)互動的從業(yè)人員和研究人員的進(jìn)入障礙,這可能是量子技術(shù)最重要的應(yīng)用之一。TKET現(xiàn)在已有數(shù)十萬計的全球用戶群。lambedq有望成為尋求與QNLP應(yīng)用程序互動之量子計算界最重要的工具包,而QNLP應(yīng)用程序是人工智能最重要的市場之一。最近出現(xiàn)的一個關(guān)鍵點是,QNLP也將適用于在基因組學(xué)和蛋白質(zhì)組學(xué)中出現(xiàn)的符號序列分析。
lambeq的推出合作伙伴,同時也是早期采用者的默克集團(tuán)最近發(fā)布了一篇關(guān)于QNLP的研究論文,這是其與慕尼黑技術(shù)大學(xué)的創(chuàng)新計劃“量子創(chuàng)業(yè)實驗室”進(jìn)行的一個項目的一部分。
來自默克IT醫(yī)療創(chuàng)新孵化器,同時也是Quantum Computing Interest Group聯(lián)合創(chuàng)始人的Thomas Ehmer表示:“利用量子計算的獨特功能實現(xiàn)根本性突破,是我們在默克開展的研究的重要組成部分。我們最近披露的與慕尼黑技術(shù)大學(xué)研究人員合作的QNLP項目證明,使用QNLP技術(shù)的句子二元分類任務(wù)即使在現(xiàn)階段也可以取得與現(xiàn)有傳統(tǒng)方法相當(dāng)?shù)慕Y(jié)果。顯然,圍繞量子計算的基礎(chǔ)設(shè)施需要取得進(jìn)步才能在商業(yè)上采用這些技術(shù)。重要的是,我們可以看到在QNLP中采用的這種方法為實現(xiàn)可解釋的人工智能開辟了道路,從而也為實現(xiàn)更準(zhǔn)確和更可靠的智能開辟了道路,而這在醫(yī)學(xué)上是至關(guān)重要的。”
Kartsaklis表示:“QNLP有許多有趣的理論工作,但理論通常與實踐有一定距離。通過lambeq,我們?yōu)檠芯咳藛T提供了獲得QNLP實驗方面實踐經(jīng)驗的機(jī)會,目前這完全是一塊未曾觸及的區(qū)域。這是朝著實現(xiàn)量子硬件上的實用、現(xiàn)實世界的NLP應(yīng)用程序成為現(xiàn)實方向邁出的關(guān)鍵一步?!?/p>
lambeq已在GitHub上作為傳統(tǒng)的Python存儲庫發(fā)布,并可在此處獲?。?a target="_blank" rel="nofollow">https://github.com/CQCL/lambeq。 迄今為止,lambeq生成的量子電路已在IBM量子計算機(jī)和Honeywell Quantum Solutions的H系列設(shè)備上執(zhí)行和實施。
上傳到arxiv上的一份技術(shù)報告對工具包進(jìn)行了介紹,該技術(shù)報告可在此處獲?。?nbsp;https://arxiv.org/abs/2110.04236。在這里可以找到一個更易訪問的博客帖子:https://medium.com/cambridge-quantum-computing/quantum-natural-language-processing-ii-6b6a44b319b2。有關(guān)技術(shù)問題,請聯(lián)系lambeq-support@cambridgequantum.com。
近年來,從客戶服務(wù)和消費者技術(shù)到醫(yī)療和廣告,基于NLP的應(yīng)用已在全球各個行業(yè)普及。行業(yè)分析師表示,預(yù)計到2028年,全球NLP市場價值將達(dá)到1272.6億美元,復(fù)合年增長率接近30%[1]。