- 科学的な記載

2014/01/03/Fri.科学的な記載

記号論的にいえば文章とはたかだか有限種の文字がたかだか有限個並んでいるだけであり本質的にはゲノム情報と変わらない。ORF から遺伝子の存在が推定できるように、欧文であれば空白文字を指標に単語の存在が確定できる。日本語は使用される文字種が多く膠着語でもあるので形態素解析に多少の困難を伴うが、それも程度問題でしかない。

今現在使われている単語の数は有限個である。全ての単語が過去に存在した単語の組合わせで定義できるなら、既知の全単語を要素とする閉じたネットワークを形成することができる。この定義ネットワークの様態は個々人によって異なる。全ての単語を知る者はおらず、語の定義にも異同があるからである。これは細胞の種類によって発現する遺伝子のセットが決まっているのと似ている。あるいは神経回路網を連想させる。

文章が人格を反映するという経験的な事実や、いわゆる文体論は、このネットワークを解析することで原理的には記述することができる。だが実際問題として、このような単語網を準備することは不可能である。「貴方が知っている全単語とその定義を記載せよ」。いかにも現実味がない。

我々が任意の個体(群)のゲノムを「標準的な」ゲノムとして便宜的に利用するように、「標準的な」単語ネットワークを構築することはできる。辞書はその原型である。

ところで、特徴や性質を論じるには二つの方法がある。一つは絶対的な評価である(彼の身長は一八〇センチです)。もう一つは標準との差異である(彼の身長は平均身長より一〇センチ高い)。生物学が個体の解析で用いる指標はもっぱら後者である。

とまれ、文章の数理的な解析には「標準的な文章」の策定が必要なことがわかる。

話を転換する。「科学的な記載」の実態とは「標準的な文章」のことではないか。科学的な記載の極北は記号論理学で用いられる命題の記述であろう。その応用が数学である。数学における証明はアルゴリズムの記述に他ならない。よく定義された人工言語であるプログラミング言語を用いると正確にアルゴリズムを実装することができる。高級なプログラミング言語になると、あるアルゴリズムが複数の方法で実装可能になる。すなわち文体が発生する。プログラミング言語でさえ文体を持ち得るのだから、自然言語で記述される科学論文が常に「科学的な記載」として不充分なのは当然といえる。

そも、科学の現場で使われているのは自然言語なのかという疑問もある。学生が研究室で浴びる洗礼の一つに、「君が何を言っているのかわからない」という教授からの叱責がある。彼は一所懸命に説明するが、それでも「わからない」と言われる。なぜか。標準的な文章を指向する科学的な記載は、自然言語の皮を被った人工言語という側面を持つからである。件の学生は自然言語を話しているのだが、教授はそれを人工言語として聞こうとするので情報が上手く伝達されないのである。

計算機のラボに入ればプログラミング言語を学ばねばならない。同様に、自然科学の研究をするにはそこで使用される人工言語を習得せねばならない。そう考えると問題点が明瞭になるが、この人工言語は一見して自然言語のように振る舞い、またその事実を明確に意識している人間も少ないので齟齬が生じる。巷間に「論文の書き方」が氾濫する所以だが、これは、How are you? と話しかけられたら I'm fine と答えなさいというのにも似た、実にくだらないノウハウである。言語を理解していないと、ゲボゲボと咳き込んでいるときにも Fine! と叫ぶ羽目になる。大丈夫なのネ、じゃあ仕事をお願い。そんなことにもなりかねない。

しかるに、科学的な記載を実現する標準的な文章を学ぶ方法は確立されておらず、全ては個人の洞察力に委ねられている。