XLNetだけでは正答率が低かった不要文除去問題をNTTの独自技術を用いて全問正解するなど、従来比30点以上(偏差値約7相当)増えた。
機械学習では正解・不正解となるデータの双方を入力してAIに正解と不正解を学ばせる。しかし、文章から不要な文を見つける不要文除去問題は、通常の文章に不要な文が含まれていないことからAIに学ばせるデータを集めることが難しく、従来は15問中6問しか正解できなかった。
このため、不要文を含まない通常の文章から文の順序を組み替えて疑似的に不自然な流れの文章を作ることで大量の不要文除去問題を自動作成し、AIに学ばせることで15問全てに正答できた。
文章中の各段落の内容を表すタイトルを選択肢から選ぶ問題、アクセント・発音問題の正答率もNTTの独自技術で大幅に高めた。