論文類似性

盗用・剽窃という恐ろしい表現がある。時々、どこぞの大学の先生が、これをやってとんでもないと上げられるあれだ。投稿論文などは、まともな出版社であれば、投稿されたものは自動で評価して、聞いたところでは20%未満だと次のチェックに入っていくそうな。装置の説明とか、その論文に沿った使い方を記すのでオリジナルになりそうなものだが、既に何億本という(大袈裟?)類似装置を使った論文があるわけで、すると、盗用・剽窃をしていなくても、勝手に似てくる。それが盗用・剽窃〇%という形で表現される。

何年前だったかは忘れてしまったが、盗用・剽窃防止というよりも、意識させるということで、特に、博士論文においては、その調査が義務付けられ、そのツール活用に掛かる費用を組織が受け持つ仕組みとなっている。博士論文はどこの大学が受理して、博士の学位を授与したのかが付いて回るから、当然と言えばそうなのだが。近年のAIの進化によって、ツールもどんどんと進化していて、バージョンが上がるごとに、チェックが厳しくなるのは当然なのだが、「従って」とか、そんなもの誰でも使うぞ!という表現を排除してくれるとかという道具も進化している。

古い書物を引用したり、その文章を剽窃しているわけではないのだが、このあたりはこれに似ているよと言われ、まぁ、ここはオリジナルを尊重しようとなると、それが盗用・剽窃〇%の中に入ってくるわけだ。やってみると実に面白くて、これはオリジナルだ、これは、うん、ちょっと先達をリスペクトしようみたいに、1センテンスごと(大袈裟)にチェックしていくと、まぁ、これくらいは納得だなという数値に収まる。トップジャーナルだと10%未満(引用文検討、当たり前表現は除く)が求められると言われる。

まぁ、博士論文をコピペで作り込む方が難しいだろうから、必然、他者出版物類似性は小さくなっていくのでしょうけれど、プログラムなどはキーとなるオリジナルの部分があれば良いと思うのですよ。その人にしか出来ない思考があって、その根拠が示されていれば。実験系の論文でも、世界初のトライで、その思考からチャレンジの仕方、アウトカムズがオリジナルで、それを既存の装置で比較出来れば共通言語でオリジナルを証明しているわけだから、それを評価すれば良いのにとは思う。まぁ、時代の流れなので仕方が無いが、類似性が10%未満と出たから文句を言うまい。