Excelで「1-1」のように入力するだけで自動的に「1月1日」と変換してくれる機能は時には便利ですが、単純に「1-1」と入力したかった場合はおせっかいに感じることも。実際に、この機能による「人間の
遺伝子の略称を勝手に日付に変換してしまう」という問題が
遺伝子学者を悩ませており、ついに科学者側が根負けして
遺伝子の名前が変更されることになったと報じられています。
Scientists rename human genes to stop Microsoft
Excel from misreading them as dates - The Verge
https://www.theverge.com/2020/8/6/21355674/human-genes-rename-microsoft-excel-misreading-datesExcelが文字列を勝手に変更し、使用者の意図しない表記に変えてしまう問題はかねてから
遺伝子学者を悩ませており、例えばヒトの細胞内に存在するタンパク質の一種「Septin 2」の名称(
遺伝子シンボル)である「SEPT2」は「2-Sep(9月2日)」に、「Membrane-Associated Ring Finger (C3HC4) 1, E3 Ubiquitin Protein Ligase」という
遺伝子の名称である「MARCH1」は「1-Mar(3月1日)」になってしまいます。
2016年に発表された研究では、
遺伝子を扱った論文3597件のうち
Excelが原因とみられるミスが見つかった論文は704件と、ほぼ20%の論文にこうした
Excelの自動変換機能の影響が現れていることが分かっています。
Excelが
遺伝子研究の誤りのもとになっていると研究者が指摘 - GIGAZINE
by John Gardner
実際に
Excelで「MAR1」と入力すると……
「1-Mar」になってしまいました。
Excelでは、こうした自動変換が発生すると表示だけでなくデータ自体が変わってしまうため、後で修正することは困難です。
遺伝子学者はセルの書式設定を「文字列」変更するなどして対応してきましたが、別の人が同じ
Excelファイルを開くとまた勝手に自動変換されてしまうといった問題もあり、解決には苦慮していたとのこと。
そこで、ヒト
遺伝子解析機構のヒトゲノム命名法委員会(HGNC)は2020年8月3日に新たなガイドラインを発表し、「データの取り扱いや検索に影響を与えるシンボル」を変えることを宣言。これにより、今後「SEPT2」は「SEPTIN2」に、「MARCH1」は「MARCHF1」と表記されることや、今後新たに発見された
遺伝子の名称は
Excelの自動変換に配慮したものになることが決まりました。
HGNCのコーディネーターを務めるエルスペス・ブルーフォード氏によると、ガイドラインが発表される前から
遺伝子名の変更は行われており、過去1年間だけで27種類の
遺伝子が名前を変えられているとのこと。
ブルーフォード氏はIT系ニュースサイトThe Vergeの取材に対し、「
遺伝子の名前は軽々しく変更していいものではありませんが、変更されること自体は珍しいことではありません」とコメントしています。例えば、これまでも名詞とまぎらわしい「CARS」は「CARS1」に、「WARS」は「WARS1」へと変更されたことがあります。
ほかにも、ヒトのがんに関連する
遺伝子の中には、ハエで見つかった同様の
遺伝子にちなんで名付けられた「headcase homolog (Drosophila)」という
遺伝子がありましたが、「headcase(キチガイ)」という差別語が含まれているため、「Hdc Homolog, Cell Cycle Regulator」に変更されたという事例もあります。
今回のHGNCの新ガイドラインは、科学者が
Excelのおせっかいに振り回されてしまった一例といえますが、ブルーフォード氏は「
遺伝子に関する論文の資料を作成するのは、
Excelの幅広い用途のうちかなり限定的なものなので、多くの
Excelユーザーを抱えているMicrosoftに機能を削除する動機がないのも仕方ないことです」とコメントしました。