凱瑟琳·西敏尤
凱瑟琳·西米尤
人工智慧和人工智慧政策研究員、技術社群組織者、投資者
發佈於 2019 年 2 月 18 日
+ 關注
大約四個月前
我開始了慢慢開始為非洲語言建立自然語言處理工具的旅程。總體目標是消除語言作為 21 世紀全球經濟成功的社會障礙。世界各地的人們都需要能夠使用自己的語言進行學習,特別是在使用電腦或存取網路上的資訊時。如果您想閱讀我在這一切開始時的最初想法,請參閱上一篇文章。
過去四個月的大
部分時間我都在做一些研究。非洲大陸的主要語言群體如下(資料來源 – 維基百科);
尼日爾-剛果大家庭,人口8億。主要族群包括阿姆哈拉語、豪薩語、奧羅莫語、索馬利語、塔切爾希特語
柏柏爾語
涵蓋北非、非洲之 具體行業聯繫資訊 角和薩赫勒地區
人口一億的亞非
家族。主要族群包括阿坎族、富拉族、伊博族、剛果族、曼德族、摩爾族、約魯巴族、祖魯族和斯瓦希里族 涵蓋西非、中非、南部非洲 文章結構與內容框架: 和東非地區
尼羅撒哈拉家
人口 萬。主要群體包括丁卡族、卡努里族、洛族、馬賽族和努爾族,佔據尼羅河谷、薩赫勒和東非地區
人口100萬的科伊桑家族。主要族群包括位於南部非洲,特別是坦尚尼亞的納馬族、桑族、桑達維族和孔族
南島語系和印
歐語係等語系在非
洲也被廣泛使用
但由於它們的起源和在
世界其他地方的突出地位
我選擇不關
注它們。下面是地理分佈圖