昨日の感情の言語学的な分析に使われたデータベース”CLICS3”について少し見てみましょう。
https://clics.clld.org/
中身を解説した論文は下記です。これは誰でも読めるopen access出版です。2020年ですから古い話ではありません。
https://www.nature.com/articles/s41597-019-0341-x
30個のデータベースを合体させたもので、1973年のものが一番古いです。
形式は単純で、下記は1016個の単語を英語、ドイツ語、ロシア語で記してあるだけです。
https://concepticon.clld.org/contributions/Dellert-2017-1016
これがネパール語、中国の少数民族(これは21言語の800単語ずつ)、タンザニア語などなどについて作られているというものです。
日本語と英語(=和英の単語対照表)もありました。2130単語です。あばら
https://clics.clld.org/languages/wold-Japanese
データ数は全部でざっと10万でしょうか。単語対照表なので、昨日紹介した関係性の強さのヒストグラムをとるような分析には向いていますね。
感情と人間性、感情を表す言葉の意味など、人間の心の奥底を解明するには物足りないような気がします。どこまでいったら「解明」になるのか、難しいですね。
実用的な観点で言うと自動翻訳機に組み込むには頼りないです。
私はやはりハードウェアとしての作り方がわからないと納得しないようです。明日は、感情が脳のハードウェアとしてどのように存在しているか、最新の研究を見てみたいと思います。
英語は上記日本語と英語の対照表から。たしかに日本語1つで英語2つ以上になっているものがかなりあります。よく見ると変なのも混じっていますが。
rib あばら
oil, fat あぶら
roast or fry あぶる
dare デア あえて
chin, jaw あご
obscure あいまい
dawn ドーン あけぼの
yawn ヤーン あくび
rain (precipitation 滴る) 雨
lame あしがふじゆうだ lame duck 任期が終わる前に力を失った大統領
millet or sorghum 粟(あわ)、キビ、モロコシ
foam 泡
carve 彫刻する
sculptor 彫刻家
chisel 彫刻刀、のみ
cease 中止する cease fire 停戦
fathom 「ファ」ぞム 尋(ひろ、長さの単位で人が手を広げた長さ)
adobe 日干し煉瓦(※知りませんでした) = a kind of clay used as a building material, a building constructed from adobe clay or bricks
blister 火ぶくれ、水ぶくれ(やけどのあとでできる液体が皮下に溜まった状態)
shriek 悲鳴を上げる
frog, return home, come back, change 「かえる」 ← これは同じ語源ではないのが混じっていますね。
hook, key かぎ(鈎、鍵) ← これは微妙で、意味の分析(semantic analysis)に値しますね。
sniff 嗅ぐ
oar オール、かい(櫂)
paddle かい(櫂)
※ たしかに、技術史的、文化史的な背景を引きずっている要素もありそうです。