newsletter

AIはデータセットに付随するオマケに過ぎない

Posted by local knowledge on May 26th, 2023

2009年に公文書管理法(正確には「公文書等の管理に関する法律」 )が成立して、2011年4月に施行されたのですが、ご存知のようにその年の3月11日に東日本大震災が発生し、この大震災の事後処理における公文書管理が極めて杜撰だったことは記憶に新しいところです。罰則規定が極めて緩い(厳重注意、で済むことが多いようです)からでしょうか。ただし(諸外国に比べ、遅まきながらではありますが)この公文書の重要性を政府や国の機関が認識した、ということはとりあえずは半歩前進だったかとは思います(現状はご存知のようにかなりお寒い状況ですけどね)。

この公文書管理法で特に着目しておきたいのは第四条です。ここでは「行政機関の職員は、第一条の目的の達成に資するため、当該行政機関における経緯も含めた意思決定に至る過程並びに当該行政機関の事務及び事業の実績を合理的に跡付け、又は検証することができるよう、処理に係る事案が軽微なものである場合を除き、次に掲げる事項その他の事項について、文書を作成しなければならない」と記されています。簡単に言えば(結果だけではなく)プロセスもちゃんと残しておけよ、ということです。公文書には「税金の使い道に関するエビデンス」という側面があるので、当然と言えば当然ですね。これが簡単に改竄(かいざん)できるようではどこにも信用できるデータがなくなってしまうことになります。

しかし(公文書に限らず、ですが)アーカイブズ(archives)全般に求められる第一義的な機能は「現在直面している困難あるいは課題を解決するために過去のデータを参照すること」にあるはずです。「似たようなことが過去にあったはずだが、その時にどう対処したのか」を探ることが現在の問題を解決するための有力な糸口になるというわけです。そうなってくるとアーカイブズは検索性能が生命線になってくるので、デジタル化すべきなのはもはや当然です。ここでデジタルアーカイブズ(digital archives)という言葉が浮上してくることになります。

デジタルアーカイブズは、公文書館、図書館、自治体や企業などは当然ですが、博物館や美術館のアート作品や写真なども極めて重要なその対象になります。特にアートは「当時のアーティストが掲げたその時代の課題」であるケースが多いので、デジタルであってもとても参考になると同時に、当該の博物館や美術館などの現地に出向くきっかけを作ってくれるわけです(実物が持つ情報量はデジタルデータとは桁違いですからね)。つまりアートが対象であっても「現在直面している困難あるいは課題を解決するための過去のデータの参照」機能は文書と同様に重要、というわけですが、デジタルアーカイブズのもう一つの重要な機能に「本来、見えないはずのものを見ることができる」という機能があります。3Dでデジタルスキャンすると「タイタニック号」写真70万枚使い“CG緻密再現”」ということが可能になったりするわけです。これはもうデジタルデータそのものが財産ですね。

デジタルアーカイブズで「見えないはずのものが見える」のは視覚的な情報に限りません。変化の傾向や統計的処理による法則性などが見えてくる場合があります。例えば折口信夫、柳宗悦、柳田國男、宮本常一あたりが残した文献や作品、フィールドリサーチの結果などを全部まとめてデジタル化して気の利いた推論エンジンを起動させ、時間軸を圧縮すれば、今まで全くわからなかった事実や傾向、あるいは未来永劫修正不可能と思われる日本独特の悪しき習慣や風土のようなものが見えてくる可能性が高い。推論エンジン自体はいわゆるAI、すなわち様々なアルゴリズムあるいはその組み合わせで作ることができる汎用品でいいのですが、元のデータセットの価値次第ではとてつもなく面白いファクトを発見できる可能性があります。データセットの品質が全体の品質を規定するわけです。そうすると(現在の)民俗学のアプローチが劇的に進化する。AIの主役は実はデータセットである、というわけです。規模の大きさ(=LLM:Large Language Model)にしか興味のない欧米の連中を尻目に、小さくても品質の高いデータセットにこだわってさっさと駆け抜けてしまったほうが(日本としては)得策な気がします。

フィールドリサーチでは絶対得られないデータを入手できる時代になると、フィールドリサーチでしか獲得し得ないデータを取得するために多くの時間を使うことができるという逆説が成立します。そしてそれ自体が学問のあり方を大きく変貌させていく可能性が高い。「我々が歴史から学ぶことは、人間は決して歴史から学ばないということだ」というヘーゲル(Hegel)の名言は少なくとも民俗学では成立しない、と言える時代が来るのかもしれません。AIによる自動翻訳が普及することで、逆に翻訳者の仕事が増えているという調査結果と呼応しているところがありますね。つまるところAIというのは全自動洗濯機(最近の洗濯機にはプロセス・インフォマティクスと呼ばれるAIが組み込まれてることが多いです)みたいなもので、本当にやりたいことができる時間を捻出してくれる便利ツールに過ぎず、「AIが仕事を奪う」と煽るジャーナリズムに加担している連中は全員阿呆だと思っておけば良いのです。『江戸商売図絵』という故・三谷一馬さんの労作(本当に“労作”です)を見れば、そこで紹介されている“職業”が現在はほぼ全てが消滅していることがわかります。つまり仕事というのはAIがあろうとなかろうと常に有為転変(ういてんぺん)していく宿命にあるのですね(実はこの書籍、新しいビジネスを考えるヒントの塊、という側面があるので、ぜひご一読ください。面白いです)。

それにしても、未だに自分の蔵書を検索する権利がないのは不条理ですよね。書店のレジで(書籍を)電子決済した瞬間に、同じスマホに購入した書籍の電子データ(電子書籍)が自動的にダウンロードされるようになるだろう、電子書籍は書籍のオマケにするのが当たり前、と予想したのはもう20年以上前なのですが、このあたりもまったく“進化”していません。にもかかわらず「結局(電子書籍は)マンガしか売れない」とぼやいている出版関係者のアタマの悪さに、今となっては愛おしさすら感じるようになってきました。というわけでここで紹介されているような学習環境で育ってきた次世代に期待するしかないんですかねえ。

ローカルナレッジ 発行人:竹田茂

最新コラムはニュースレターでお送りしています。お申し込みは下記から

ニューズレター登録はこちら