小林裕和
(株)グリーン・インサイト・代表取締役/静岡県立大学・名誉教授・客員教授
1950年代生まれの私にとって、ロボットと言えば、「鉄腕アトム」 や 「鉄人28号」。未来のイメージは、「宇宙家族」 シリーズのアニメだった。当時の日本は、高度経済成長の真っ直中。なので、自分の生きているうちにそのような時代が来るように思えた。「もの」 としてのロボットよりも前に、デジタル技術に遭遇した。私の研究分野では遺伝情報を扱う。1970年代後半、DNA塩基配列 (遺伝情報) の解読ができるようになった。遺伝情報は、A、C、G、Tの4文字の並びに秘められている。A、C、G、Tの1つずつを塩基と呼ぶが、仮に100塩基なら、その並び方の可能性は、4¹⁰⁰ (1.6 × 10⁶⁰) になる。このような情報を扱うにはヒトの頭では無理になってきた。そこで、パソコンを活用するようになった。アメリカ合衆国ではIBMとCommodore、日本ではNECが主力であった。1984年に博士研究員を終えて帰国した私は、NECのPC98シリーズを購入。月給の4ヶ月分ぐらいしたので今でも家内に根に持たれている。それは、ワープロとしても使えるようになった。私の職場は名古屋大学・アイソトープ総合センターだった。そこでは放射性同位元素を実験に使うため、研究者の出入を管理する必要がある。現場に直結したデジタル技術として、1980年代後半、パソコン制御による管理区域への出入管理システムを外部委託により構築した。人物を同定するために、映画 「007」 張りの網膜像読み取り装置まで導入した。その頃のパソコン通信は電話回線を介し、モデムが活躍していた。1991年に静岡県立大学に赴任して、新築の建物ではLANケーブルが壁中に埋設されているのに感動した。前職の名古屋大学など多くの大学では、建物の廊下の天井に多数のケーブルがむき出しで這っていた。その後、モデム通信からSINETを介するインターネットへと移行した。
現在まで、Macを中心にパソコンを3〜4年おきに買い換え、その都度記憶媒体が10倍ずつ増えることに感動してきた。MB (メガバイト, 10⁶) から始まり、その1,000倍のGB (ギガバイト, 10⁹)、今はさらに1,000倍のTB (テラバイト, 10¹²)。すなわち、100万倍になった。現在のデジタル情報の世界総量は、150 ZB (ゼタバイト, 10²¹) ぐらいだといわれている。TBの1,000倍がPB (ペタバイト, 10¹⁵)、その1000倍がEB (エクサバイト, 10¹⁸)、その1,000倍がZBだ。情報科学の理解以外の目的でこのような数字を扱うことはない。「兆」 (10¹²) の上が 「京」 (けい:10¹⁶)、「垓」 (がい:10²⁰) とのこと。すなわち、1500垓。このような膨大な情報から欲しいものを抜き出すのが、「検索」 技術であるが、現在の最進化型が2023年3月に登場したChatGPT4。”GPT” とは、”Generative Pre-trained Transformer (生成可能な事前学習済み変換器)”。先端技術の恩恵に預かりたい私は、これを重宝しているが、この作業はファジーに感じることが多い。すなわち、「人間味」 がある。表示の欄外に、「ChatGPTは間違いを犯す可能性があります。重要な情報は確認することをお勧めします。」 と逃げをしっかり打っている。その限界として、150 ZBの情報には著作権で保護されている部分があり、これらが使えないことが挙げられる。ChatGPTの仕組みに関する部分は判断ができないので、ChatGPT自身に聞いてみた。そうすると、私の指摘事項を含む 「データとトレーニングの限界」、つぎに、「技術的な制約」。すなわち、現在の技術では、全ての情報を完全に正確に解釈、再現することは難しい。これは、理解や生成のプロセスに固有の不確実性や限界があるためとのこと。最後に、「抽象的な概念の解釈」、これは抽象的な概念や曖昧な記述の解釈に起因するとのこと。その結果生じる虚偽が、自信を持った表明に見える。これは、専門用語として 「幻覚 (hallucination)」 と呼ばれるようになった。意図を伴った虚偽が埋め込まれることもあるが、そうでない前提に立ちたい。その場合、最先端デジタル技術は結構 「気分屋」。人間に近く、怒らせないように使わなければならないとさえ感じる。
Kommentare