賽題名稱:基于深度學習的銀行卡號識別系統
組類: A 本科及以上
賽題簡介:介紹整個賽題的思路和整體要求
人類對外界信息的認識及感知,最基本的就來自于視覺,因此對視覺信息的搜集與處理,一直是人類認識世界、認識規律的重要手段。人工智能技術,通過對視覺信息的采集,對圖形圖像信息做科學的篩選、比對并分析,然后經過算法(深度學習)、理解和思考之后,將真實的現實內容呈現在計算機中。
隨著人工智能、深度學習技術的發展,人工智能技術在視覺領域方面的應用日益突出,得到了廣泛的關注和研究。本題要求同學們使用基于深度學習的視覺識別技術,拓展現有的光學識別技術(OCR)來完成一個識別銀行卡號的系統,此系統包括數據集處理、銀行卡號定位檢測、銀行卡號識別三部分。本賽題要求使用深度學習技術體系完成,本題的目的不僅在于比試,更重視參賽同學的個人提升。
賽題業務場景:描述賽題相關的真實企業業務背景。從真實場景中,適當簡化或者提煉出適合比賽的賽題場景
由于移動互聯網的迅速發展,移動支付成為最主流的支付方式之一,同時在生活中,很多場景會涉及到銀行卡的綁定與識別。例如:
場景一:手機支付綁定銀行卡
微信支付或支付寶支付,均需提前綁定銀行卡,通過掃一掃功能,掃描銀行卡,自動識別卡號,進行后續的驗證操作。
場景二:銀行轉賬業務
銀行進行業務前,都需要提供銀行卡,掃描銀行卡,進行卡號識別操作。
銀行卡的智能識別需求非常廣泛,它不僅可以提高工作效率、減少人工成本,同時也可以提升用戶體驗。
現有的各大科技公司都提供了對應的接口來實現字符識別功能,本題結合企業應用,同時考慮到同學們的資源限制,要求只實現銀行卡號定位及銀行卡號識別兩個核心功能。
功能性需求
1.數據集處理
根據本賽題提供的數據集(共1084張卡號截圖及標簽)實現數據增強模塊,將數據集中的每一張圖片使用數據增強方式拓展為80張圖片,為之后的圖像識別訓練提供充足的數據樣本,并且該模塊程序能夠繼續處理新加入的數據樣本。
2、程序定位銀行卡卡號
實現銀行卡號文本的檢測定位,此模塊能夠將拍攝的銀行卡卡號部分檢測出來,并截取相應部分供后續的識別模型使用(銀行卡盡量充滿圖片,橫向放置),能夠讀取放入到文件夾的銀行卡圖片。
3.程序實現銀行卡號字符識別
此模塊要求使用數據增強后的數據集訓練字符識別模型,最終模型能夠識別出賽題提供的測試銀行卡卡號以及自拍的銀行卡卡號。
4.采用GUI(圖形用戶界面)
提供良好的用戶交互式界面實現。
非功能性需求
1.程序源碼要求結構清晰,模塊區分較為明確,提供便于讀者閱讀的源碼指南,及項目使用文檔。
2.使用人工智能領域深度學習技術進行實現,提供文本檢測模型、文本識別模型。
3.使用GPU(圖形處理器)加速計算。
4.提供模型訓練過程截圖,模型測試指標信息。
其他限制條件:開發環境、實驗平臺、開發語言、數據庫、編譯器等限制條件(請盡量明確)
1.操作系統可選Windows、Linux。
2.開發語言不限(推薦使用Python3)。
3.推薦使用TensorFlow或Keras實現模型訓練,但不限其它機器學習工具。
4.請標注系統中哪些部分使用了開源代碼、模型及出處。
測試數據或平臺:提供給參賽者的測試環境和測試數據。(可提供電子檔)
提供源數據集1000張左右,原始數據集為人工處理銀行卡號截圖,樣例如下(文件名為人工手動標注號碼):
提供測試銀行卡,樣例如下:
開發所需設備及設備指標需求說明
1.推薦數據處理部分使用主流配置(i5及以上)電腦即可。
2.圖片拍攝可使用移動設備。
其他要求
1.不能使用市場上各公司在線api接口進行功能實現。
2.鼓勵使用開源工具、算法。
3.模型在數據集中的準確率要求達到90%,準確率較高的需要模型同樣有泛化能力,能夠識別自拍的銀行卡卡號。
4.評分標準:
(1)數據集處理模塊15分;
(2)程序定位銀行卡卡號模塊15分;
(3)程序實現銀行卡號字符識別15分;
(4)采用GUI(圖形用戶界面)15分;
(5)非功能性每一條建議5分,共20分;
(6)綜合20分,系統最終達到的準確率、程序運行速度、界面友好度、代碼規范性等。
5.提供完整項目的源代碼。
6.不得作弊抄襲。
7.參賽者需制作項目展示的媒體文件,內容包括需求文檔、設計文檔、使用說明書等軟件開發文檔。
資料下載.rar 提取碼:gljp
出題企業:北京課工場教育科技有限公司
答疑方式:劉老師 電話:15101673930 郵箱:pai.pin@kgc.cn 答疑QQ群:529832375