複数種の固有名詞にまたがる曖昧性を新発見
なにやら学術っぽい雰囲気の題名にしてしまいました。
しかし、ネタは、MSNにあった珍談、bizarreなお話です。
映画「バットマン」、無断で市名を利用、トルコのバトマン市提訴へ
記事のヘッドラインらしい、格助詞「が」「を」を欠いた、舌足らずな表現なので、どっちがどっちを提訴したのか一瞬迷いました。が、「無断で市名を利用」だから、市が映画製作者を訴えたのだろう、となります。これを、
[NLP] 複数種の固有名詞にまたがる曖昧性を新発見
と表現したのは、Mextractrが抽出する5W1H固有表現(固有名詞や数量表現など、特定の1つの存在、事象を指示参照する表現のこと)の中で、WhatなのかWhereなのか、などの曖昧性解消タスクが増えた!と思ったからです。
Batman →架空の個人名(WHO)か、映画の題名(WHAT) だけかと思ってました。
しかし、文脈によっては、
も抽出しなければならないとは大変だ!と思った次第です。
元記事の提訴がとおるかですが、、多分だめだと思います。
連想されるのは、商標権ですね。商品やサービス、ブランド一般を識別するにあたって、【同じジャンルで】先に使っている例があったら登録不可、とするのが商標権の基本的考え方。したがって、5W1Hのレベルで、ぜんぜん違う役割を担い、通常、使用目的が違い、市場が違う名称がバッティングする (batting: 蝙蝠のまねをするっていう意味もあるかも。。 ) ことはない、というのが、西欧的近代文明では通念になっているからです。近年は中国も追認しているはずです。
確かにイスラム圏ではわからない。でも、
トルコは昔は小アジアといわれつつ、EU加盟を目指し、自分はヨーロッパだ、と主張しています。
この小さな提訴は、その道をわずかながら遠ざけるはたらきをするかもしれません。
※と真面目に反応してみる。。