為什么傳統(tǒng)的測(cè)試方法不能保證AI軟件的質(zhì)量？

更新時(shí)間:2019年12月11日14時(shí)42分來(lái)源:傳智播客瀏覽次數(shù):

近兩年人工智能發(fā)展迅猛，各種應(yīng)用層出不窮，但其質(zhì)量卻是良莠不齊。原因在于大部分測(cè)試童鞋還在用傳統(tǒng)的測(cè)試方式也就是通過(guò)界面和功能對(duì)人工智能軟件進(jìn)行測(cè)試，但是AI軟件從開(kāi)發(fā)到測(cè)試都很不同于傳統(tǒng)軟件，本文就以智能文本分類系統(tǒng)為例通過(guò)兩步來(lái)介紹為何傳統(tǒng)的測(cè)試方法不能保證AI軟件的質(zhì)量。

一、工智能軟件測(cè)試的痛點(diǎn)

目標(biāo)

掌握人工智能軟件測(cè)試面臨的現(xiàn)實(shí)痛點(diǎn)

步驟

1.智能文本分類系統(tǒng)是AI自然語(yǔ)言處理的一個(gè)基本應(yīng)用，界面如下圖所示

1576046122215_人工智能測(cè)試.jpg

2.對(duì)其測(cè)試時(shí)需要根據(jù)不同的輸入點(diǎn)擊獲取標(biāo)簽得出所屬的類別以及所屬類別的概率值

3.通過(guò)功能和界面進(jìn)行測(cè)試的話需要輸入各種可能輸入的文本，耗時(shí)巨大，并且也不太現(xiàn)實(shí)

4.從界面上對(duì)得到的score代表的概率值進(jìn)行判斷無(wú)法得出一個(gè)客觀的評(píng)判，這個(gè)值多少合適判斷不了

5.因此傳統(tǒng)界面和功能測(cè)試完了判斷不了智能文本分類系統(tǒng)能否上線

二、AI軟件測(cè)試的正確方式

目標(biāo)

掌握AI軟件測(cè)試的正確方式

步驟

1.了解AI軟件測(cè)試的本質(zhì)

人工智能軟件是根據(jù)算法對(duì)大量的數(shù)據(jù)進(jìn)行訓(xùn)練找規(guī)律，最終得出一個(gè)模型來(lái)對(duì)新的數(shù)據(jù)進(jìn)行預(yù)測(cè)，預(yù)測(cè)的時(shí)候會(huì)給出一個(gè)概率值。

2.AI軟件測(cè)試的正確方式

通過(guò)實(shí)現(xiàn)人工智能算法自帶的評(píng)測(cè)指標(biāo)來(lái)進(jìn)行AI軟件的測(cè)試可以很好的評(píng)估軟件的質(zhì)量，完美解決窮舉各種輸入和概率值大小的現(xiàn)實(shí)問(wèn)題

3.通過(guò)AI模型測(cè)試的具體評(píng)測(cè)指標(biāo)

以智能文本分類為例，其采用了監(jiān)督示機(jī)器學(xué)習(xí)的分類算法，對(duì)應(yīng)的評(píng)測(cè)指標(biāo)有：

準(zhǔn)確率、精確率、召回率

總結(jié)

本文通過(guò)智能文本分類系統(tǒng)面臨的測(cè)試難點(diǎn)來(lái)指出AI軟件測(cè)試過(guò)程中的通用難題。以此指出了通過(guò)功能和界面測(cè)試人工智能軟件不能保證AI軟件的質(zhì)量，正確的方式應(yīng)該是通過(guò)實(shí)現(xiàn)AI軟件算法自帶的評(píng)測(cè)進(jìn)行進(jìn)行測(cè)試。

上一篇：如何編寫完整的測(cè)試用例？3分鐘學(xué)會(huì)！ 下一篇：分步驟演示對(duì)人工智能軟件進(jìn)行冒煙測(cè)試