機器之心報道
作者:澤南
高度模塊化和可擴展的設計是 FaceX-Zoo 的優(yōu)勢。
近年來,基于深度學習的人臉識別技術取得了重要進展。但是人臉識別模型的實際部署和深入研究都需要相應的公眾支持。例如生產級人臉表示網(wǎng)絡需要模塊化的訓練機制,以配合不同 SOTA 骨干網(wǎng)絡、訓練監(jiān)督主題再到現(xiàn)實世界人臉識別需求。至于性能分析和比較,基于多個基準的大量模型也需要一個標準和自動化的評估工具。此外,人們希望能夠出現(xiàn)一種以整體流水線形式部署的人臉識別公共基礎。
最近還出現(xiàn)了一系列新的挑戰(zhàn),例如疫情期間出現(xiàn)的戴口罩人臉識別需求,這在實際應用中引來了人們的關注。一個可行的解決方式是建立起一套易用的統(tǒng)一框架來解決這些問題。
今年 1 月,來自京東的研究人員面向人臉識別技術開發(fā)社區(qū)提出了全新的開源框架 FaceX-Zoo。依靠高度模塊化和可擴展的設計,F(xiàn)aceX-Zoo 提供具備多種多種 supervisory head 和骨干網(wǎng)絡的訓練模塊,以實現(xiàn)效果最優(yōu)的人臉識別。此外,它還具備標準化評估模塊,以便在大多數(shù)情況下測試模型效果。
在這個工具中,人們只需改動簡單的配置就可以在大多數(shù)流行基準上進行模型測試。此外,它還有一個簡單但功能齊全的人臉 SDK 用于驗證訓練后的模型,并進行初步應用。該工具并不包含大量現(xiàn)有技術,但也因此易于拓展升級。
最近,這一工具已被開源。
GitHub 鏈接:https://github.com/JDAI-CV/FaceX-Zoo
該工具的環(huán)境需求如下:
Python >= 3.7.1
pytorch >= 1.1.0
torchvision >= 0.3.0
FaceX-Zoo 提供了 MobileFaceNet、ResNet、 SE-ResNet、HRNet、EfficientNet 等較為流行的骨干網(wǎng)絡以方便提取面部特征。如果這還無法滿足你的需要,只要修改配置文件、添加架構定義文件,在 PyTorch 的支持下你就可以輕松自定義任何其他選擇。
使用 FaceX-Zoo 中 FMA-3D 工具為照片中的人物戴上口罩,填充蒙面人臉數(shù)據(jù)集。
不同骨干網(wǎng)絡的性能評估。
不同 supervisory head 的性能評估。
京東的開發(fā)者們表示,在未來研究人員還計劃進一步增加 FaceX-Zoo 的模塊數(shù)量,如面部分析和 face lightning,補充骨干網(wǎng)絡架構和 supervisory head 數(shù)量,并嘗試通過分布式數(shù)據(jù)并行技術和混合精度訓練來提升模型訓練的效率。
相關論文:https://arxiv.org/abs/2101.04407