• 智能翻译解决方案提供商
    memoQ中国区销售服务商

阿拉伯语的外国人名数据库

由于人名在命名实体提取和机器翻译等自然语言应用中发挥着重要作用,我们正在不断扩展和修订其专有名词资源,这些资源系统地涵盖了阿拉伯语的拼写变体和常见的拼写错误。

我们的研究所在包括阿拉伯姓名专家在内的国际合作下,开发了收集、验证和证明用阿拉伯语书写的非阿拉伯姓名的新技术,目前正在建立一个阿拉伯语外国姓名数据库,称为DAFNA

下面的例子显示了一个普通美国人的名字(John)和一个普通美国人的姓氏(Davis)的拼写变体和拼写错误。美国人名的原始数据是从美国人口普查局获得的。还有更大的样本。

数据样本

Arabic Variants of John (Male First Name) and Davis (Surname)

ENGLISH

ARABIC

WEB FREQ (English+Arabic)

WEB FREQ (Arabic only)

John

جوون

36500

44500

John

جون

32700

947000

John

جان

31300

2160000

John

جوهان

224

7090

John

جوهن

173

1180

John

دجون

29

1680

John

جهون

9

328

Davis

ديفيس

613

12300

Davis

دافيس

249

1680

Davis

ديفز

228

2300

Davis

ديفس

157

2020

Davis

دايفس

40

652

Davis

دفيس

34

490

Davis

دفيز

5

98

更多阿拉伯资源:

阿拉伯地名数据库

阿拉伯人名数据库

阿拉伯语的阿拉伯人名数据库

阿拉伯语的地名数据库