語音識別與速錄速記技術的區別

才智咖 人氣:3.12W

在速錄群中,經常有人推銷所謂的“音訊轉換文字”的軟體;在會議現場,經常會被與會嘉賓問到:現在都有語音識別了,你們速錄師是不是該下崗了……這導致很多有志於速錄事業發展的青年才俊對語音識別代替人工速錄表示極大的擔憂。今天我也就語音識別與人工速錄談談自己的看法。

語音識別與速錄速記技術的區別

雖然從發展的眼光看,人工智慧代替純手工速錄是歷史發展的必然趨勢,但從現有的科學技術來看,路還很長。

十年前,當我打算重新投身於速錄事業之際,和很多人一樣,對速錄的可持續發展持有疑慮,對語音識別代替速錄技術同樣表示擔心。恰逢同學回國,聊起此事。同學對投身速錄事業表示讚賞,並補充說:美國的速錄師從業人數非常多,速錄技術應用非常廣泛。還舉例說:一千人蔘加的會議,只要有一位聽障人士,會務組必須單獨為其配備速錄師。談到語音識別對速記、速錄的影響(當年有機構開發這類軟體),美國的語音識別技術發展非常超前,但是美國現有的語音識別技術也只限用於軍事、醫療這種標準化程度非常高的行業。

拋開語種的差別,漢語言的博大精深咱不贅述。單從中國的軟體技術與美國相比,差距可不止是一點點。美國的語音識別技術也只是在極少數專業領域進行發展和應用,中國的語音識別技術怎麼可能在短時間內完成這種華麗轉身呢?

有人可能會說,你同學說的為什麼要聽?他說的就代表權威嗎?所以必須得說明,該同學當時受聘於美國知名IT公司,從事語音識別技術研發工作,方向是英語語種,其夫人受聘於同一家公司,從事同類工作,方向是阿拉伯語系。

可能上面的故事不足以讓大多數人頓悟,下面我們就以實戰進行分析。瞭解速錄的人都知道,速錄師有國家標準,標準裡的關鍵詞是速度、準確率。現在就以這兩個關鍵詞為基礎,結合影響會議的相關因素,對語音識別與人工速錄進行綜合比對。

※ 錯字數以A4紙為例,滿頁5號字,約1500字。

分析:

1.準確率

相信絕大多數一線速錄師會議記錄現場交稿的準確率不低於99%(95%以上只是行業標準),但即使99%以上的準確率(即一頁紙錯15個字以下),很多嚴苛的.單位還是相當不滿意。所以大多數時候,速錄師會把錯誤率控制在千分之三以下(主要是專業術語的誤聽)。

反觀語音識別,語音識別推銷的廣告詞往往是“高辨識度,準確率高達80%以上”。我想請問,80%的準確率(即單頁錯300個字)這還能算是文稿嗎?

2.速度

兩者都能同步記錄。

3.會場環境

當會場環境較惡劣時,比如話筒音量不夠或無話筒,離音源較遠,夾雜著各種聲音,我不知道軟體該如何去識別?但我知道,我們速錄師能。

4.文稿美觀度

帶過實習生的速錄師都知道,很多實習生對於分段特別不適應,所以改他(她)的文稿特別累。光分段就會讓你好好地去重聽整個音訊,因為不分段的文稿客戶是不會滿意的。而語音識別恰恰就是永遠不分段。

一線速錄師的文稿一定會做到分段、分層次、分角色,而且會做到段落清楚,層次分明。角色,我特別提出來,多人對話、現場激烈討論這種場景,是我們速錄師碰到的常態,電視節目“扒詞”是要分角色的,但不管哪種情況,角色絕不會自報家門,全靠速錄師同步新增,這一點所謂的語音識別永遠做不到。

通過分析,高下立判,優劣一目瞭然。

一點拙見,希望對想步入速錄大家庭的你能有所幫助。

更希望有超強的語音識別脫穎而出,雖然目前不可能。