由于人名在命名实体提取和机器翻译等自然语言应用中发挥着重要作用,我们正在不断扩展和修订其专有名词资源,这些资源系统地涵盖了阿拉伯语的拼写变体和常见的拼写错误。
我们的研究所在包括阿拉伯姓名专家在内的国际合作下,开发了收集、验证和证明用阿拉伯语书写的非阿拉伯姓名的新技术,目前正在建立一个阿拉伯语外国姓名数据库,称为DAFNA。
下面的例子显示了一个普通美国人的名字(John)和一个普通美国人的姓氏(Davis)的拼写变体和拼写错误。美国人名的原始数据是从美国人口普查局获得的。还有更大的样本。
Arabic Variants of John (Male First Name) and Davis (Surname) |
ENGLISH |
ARABIC |
WEB FREQ (English+Arabic) |
WEB FREQ (Arabic only) |
John |
جوون |
36500 |
44500 |
John |
جون |
32700 |
947000 |
John |
جان |
31300 |
2160000 |
John |
جوهان |
224 |
7090 |
John |
جوهن |
173 |
1180 |
John |
دجون |
29 |
1680 |
John |
جهون |
9 |
328 |
Davis |
ديفيس |
613 |
12300 |
Davis |
دافيس |
249 |
1680 |
Davis |
ديفز |
228 |
2300 |
Davis |
ديفس |
157 |
2020 |
Davis |
دايفس |
40 |
652 |
Davis |
دفيس |
34 |
490 |
Davis |
دفيز |
5 |
98 |
更多阿拉伯资源:
© Copyright 2023. 大辞科技 沪ICP备17050550号 沪公网安备 31011402006110号