ミニ特集「情報学と自然言語処理」:「理容師」と「美容師」 〜法律に対する自然言語処理から見えてくるもの〜
自然言語処理
CやPythonなどのプログラミング言語を「人工言語」と呼ぶのに対して、我々が日常で使用する日本語や英語のことを「自然言語」と呼びます。そうした「自然言語」をコンピュータで処理することを「自然言語処理」と呼びます。我々、名古屋大学大学院情報学研究科外山研究室では、そうした自然言語処理を法律の分野に適用する研究をしていますが、そうした研究を通じて、いろいろと見えてくるものがあります。
「理容師」と「美容師」
「美容師」と「理容師」の違いはご存知でしょうか?
前者は美容院で髪を整えてくれる人であり、後者は床屋で髪を切ってくれる人です。両者は良く似ていますが、それぞれ異なる免許が必要ということを知っている方も多いでしょう。免許があるということは法律で定められているということになります。法律では「床屋」と言わずに「理容師」というちょっと固い言い方をしますが、実は最初の法律では「理容師」は今とは別の意味だったのです。
「理容師法」という法律は昭和22年12月24日に昭和22年法律第234号として制定されました。この中身を読むと、「この法律で理容師とは、理髪師及び美容師をいう。」という文面が出てきます。さらに続いて、「この法律で理髪師とは、理髪を業とする者をいい、美容師とは、美容を業とする者をいう。」とあります。つまり、この当時は、いわゆる「床屋さん」のことは「理髪師」と呼び、「理容師」とは「理髪師」と「美容師」を合わせた言い方だったのです。「理髪師」の「理」と、「美容師」の「容」を合わせて「理容師」だった訳ですね。
「理髪師」という言葉は今では聞き慣れない言葉ですが、ロッシーニのオペラに「セビリアの理髪師」というものがあります。これは、「セビリアの理髪師」のタイトルが日本語に翻訳された当時、床屋のことを「理髪師」と呼んでいた証拠です。
しかし時代がたつにつれて、「理容師」という言葉から「美容師」の意味が抜けていき、「理髪師」だけを指す言葉になっていきます。そうした変化を受け、「理容師法」は昭和26年6月30日に改正され、そのときに法律の題名も「理容師美容師法」に改められます。本文においても、「理髪師」は「理容師」に、「理容師」は「理容師又は美容師」に改められます。
その後、昭和32年6月3日には、この法律は「理容師法」と「美容師法」の二つに分けられ、現在の法律に繋っていきます。つまり、昭和22年の「理容師法」は「床屋さん」と「美容師」の両方に関する法律だったのですが、現在の「理容師法」は「床屋さん」だけを扱う法律になります。
現代では「理容師」と「美容師」と合わせて「理美容師」と呼ぶことがありますが、この単語は法律には出てきません。ただし、法律より下のレベルの省令では、「介護保険法施行規則(平成11年厚生省令第36号)」の中に「理美容代」という表現が出てきます。
法律を対象とする自然言語処理
ちなみに、この「理容師」という言葉の変遷には、法律に対する自然言語処理を行っている途中で気付きました。
我々は法律の専門家ではありませんから、法律を全部読むようなことはせずに、コンピュータに処理させます。その際に、昭和22年法律第89号以降に制定された法律の、制定時のテキストを全部集め、出現する単語の分布がどのように変化するかを調べてみました。
例えば「公害」という単語は、昭和40年代に制定された法律に多く出現しており、当時、日本国内で公害が大きな問題になっていたことが分かります。
また、ある時点から使用されるような単語もあります。例えば「子ども」という単語が出現するのは「特定非営利活動促進法」(平成10年法律第7号)が最初になります。この法律はNPO法とも呼ばれていて、法律が作られる過程で一般の人の意見が反映されたために、従来の法律では使用されてこなかった「子ども」が使われたのだと思われます。
一方で、ある時期からまったく使用されなくなる単語もあり、その一つが「理髪」でした。そこで「理髪」を調べたところ、「理容」という単語の意味の変遷に気付きました。
おわりに
言葉は時代とともに変化します。昔の研究者は数多くの文献を調べて、その変化を捉えてきました。しかし、コンピュータによる自然言語処理の技術を使えば、また違った方法で言語の変化を捉えることが可能になります。そうした点が、自然言語処理の魅力の一つです。
小川 泰弘(情報基盤センター/知能システム学専攻)