在菜市場,我們不用擔心零錢問題,刷刷手機就能付款;在火車站,我們不用排隊取票,刷刷身份證就能順利進展;回到家,我們不怕忘帶鑰匙,刷刷指紋就能開門。
這些便利,離不開計算機識別技術的發展。計算機識別技術,又被稱為模式識別,是指通過計算機用數學技術方法來研究模式的自動處理和判讀。“模式”按照分類依據的不同,可以被分成不少種類別,比如按照識別對象的不同,可以分為對環境的識別和對客體的識別。若是這個客體是人類的話,我們又可以把模式識別分為光學信息識別和聲學信息識別等類別。
20世紀40年代至 20世紀50年代,隨著計算機及AI的誕生,模式識別的概念也應運而生。到了20世紀60年代,模式識別技術迅速發展,成為一門新興的學科。早期的模式識別技術的研究重點主要集中在數學方法上,統計決策理論方法求解模式識別問題的理論極大的促進了模式識別研究的發展。而后,有科學家將模式識別的研究方向轉移到了人工神經元網絡領域,學者們發現計算機網所具有的存儲和計算能力,將給模式識別技術帶來新的革新。人工神經元網絡技術也不負所望,在短短幾年內就極大的推動了模式識別技術的發展,取得了不少應用上的成果。
模式識別技術之所以能夠飛速發展,離不開它的顯著特點。與人工相比,模式識別技術的優點非常顯著,速度快、準確度高,即效率高。對于飛速發展的市場而言,效率無疑與競爭力與效益直接掛鉤,這對于任何一個領域而言,都是不能放棄的“關節”般的技術。
隨著模式識別技術的不斷發展,其所應用的領域不斷拓寬,與其它學科的交叉也日益增多。不過,從模式識別系統的本質上來看,模式識別的關鍵就是利用模糊數學的理論去解決分類識別的問題。按照識別技術所應用的領域的不同,目的的不同,所采用的識別方法也不同。不過總體而言,模式識別系統基本上可以由三個部分組成,分別是數據的采集與生成,數據分析與數據分類。
模式識別的發展方向多樣,目前主要有圖像處理、計算機視覺、語音語言信息處理等研究方向。
圖像處理技術很好理解,即用計算機對圖像進行處理的技術。圖像處理技術在模式識別上的應用,需要讓計算機從圖像中抽取某些有用的度量、數據或信息,并進行分析,進而進行分類與識別。在模式識別的實際應用中,圖像處理技術往往作為前置處理步驟出現,需要聯合計算機視覺等技術才能完成實際應用。
計算機視覺技術是指使用設備對目標進行識別、分析和處理的一項技術。計算機視覺技術的主要任務,就是模擬生物視覺,對所采集到的圖像數據進行處理,并獲取相應場景的三維信息。對于人類以及其他生物而言,通過視覺感知環境是一種編進基因中的本能,但這對于計算機而言卻極具挑戰性。計算機視覺是一門綜合性的學科,包羅計算機科學和工程、信號處理、物理學、應用數學、統計學、神經生理學和認知科學等學科。
語言信息處理是語言學與計算機科學交叉形成的一門學科,其理論基礎就是計算語言學。計算語言學可以通過建立形式化的數據模型,去分析、處理自然語言,最終達到使用機器模擬人類的部分乃至全部語言能力的目的。自然語言是人類在自身發展過程中所產生的語言,比如我們所學習的中文、英文。而計算機語言是人工語言的一種,是用于人與計算機之間傳遞信息的語言,比如我們所學習的C語言、python。
隨著全世界信息產業的飛速發展,我們即將邁入數字經濟時代。在數字經濟時代,市場對于模式識別技術的需求也會日益增加,這也將進一步推動其產業化的發展。
譬如說,隨著大數據時代的到來,信息的傳播維度與豐富度不斷增加,文字、語音、圖像、視頻等不同形式的信息往往會同時出現。我們從2G邁入5G的過程中,互聯網的數據也從單模態轉變到了多模態。這種轉變帶來了不少新的經濟效益,比如播客、視頻博主乃至直播行業的興起,都受益與互聯網信息的多模態發展。這種發展,也推動了模式識別技術從單模態識別到多模態識別的發展。模式識別技術只有適應了多模態的數據信息,才能用好這些寶貴的數據,為我們提供諸如“個性化推薦”這樣的功能;也才能管好這些寶貴的數據,為我們的網上沖浪提供隱私保護與清朗的環境。
在其它行業上,由于單一的模式識別技術各有優缺點,在應用上難免會出現一些問題。所以,在一些安全等級要求較高的應用場景當中,往往需要采用兩種甚至兩種以上的模式識別技術。而隨著物聯網時代的到來,這種多方法聯合的模式識別技術也有望走向現實,為我們的日常生活與工作,提供更可靠的保障與更人性化的便利。
模式識別技術對于大數據、AI、物聯網、智慧交通、智慧醫療等關鍵信息化進程具有重要意義,而隨著數字經濟時代的到來與國家對于科技創新的大力投入,識別技術的市場進一步擴大,中國在識別技術上也有了長足的進步,前景可期。