介紹 ZUNA,一個擁有 380M 參數的 BCI 基礎模型,用於 EEG 數據,這是非侵入式思想轉文本發展中的一個重要里程碑。 完全開源,Apache 2.0。
非侵入式腦電圖(EEG)數據易於獲取且信息密集,為思想轉換為文本的腦機介面(BCI)應用提供了實用的基礎。 EEG 通過頭皮電極記錄大腦的電活動,以診斷各種神經系統疾病並監測大腦狀態。
雖然EEG數據信息豐富,但通常雜亂無章,受到通道掉落、運動伪影和稀疏電極覆蓋的困擾。 ZUNA從EEG數據中重建高保真腦信號,使得在不需要額外硬體的情況下,能夠進行更好的診斷、研究和BCI應用。
擁有較少 EEG 感測器的設備在可及性與信號覆蓋之間進行了權衡。 ZUNA 從稀疏數據和電極坐標中預測缺失的通道,提供臨床級信號,這些信號可以從消費者耳機擴展到 256 電極的研究系統,且無需重新訓練。
ZUNA 在遮罩和未見的 EEG 數據集上,顯著超越了傳統方法,如 MNE 的球面樣條插值。 隨著上採樣率的提高,尤其是在 4 倍時,其優勢愈加明顯,傳統方法則會失效,而 ZUNA 表現出色。
ZUNA 在 208 個 EEG 數據集上訓練了 200 萬小時的頻道,使用了遮罩擴散訓練和 4D 空間嵌入來在數據集和任意電極佈局之間進行泛化。
我們很高興地分享 ZUNA。Zyphra BCI 團隊的出色工作。 @ChrisWarnerII @JonasHMago @jonhumlatnight @BerenMillidge 有興趣合作以改善未來版本以滿足特定需求或用例的人,請聯繫 @PaulWhiteIRL @dannymartinelli
334