ハノイ工科大学の2026年第2回思考力評価(TSA)試験の首席が9問の誤りにもかかわらず98.98/100点を獲得したことは、受験生と保護者から注目を集めています。
これらの懸念に先立ち、ハノイ工科大学入学・キャリアガイダンス委員会の委員長であるブー・ズイ・ハイ准教授・博士は、従来の計算方法ではなく、現代的な教育測定モデルによる採点メカニズムを明確にするために、報道機関と意見交換を行いました。
合計点は、正解の総数だけに基づくものではありません。
ブー・ズイ・ハイ准教授・博士によると、長年にわたり、ベトナムの試験では粗略な採点方法、つまり正解された問題ごとに同じ点数を計算し、合計して最終結果を出す方法を使用しています。

この方法は簡単ですが、特に質問の難易度が異なる場合、同じ数の正解した受験生の能力レベルを区別できないという制限が明らかになりました。
実際には、同じレベルの点数を獲得した2人の受験生は、難易度が同等でない異なる質問グループを正しく解いた可能性があります。その場合、点数は能力を正確に反映しておらず、試験問題間または難易度が異なる試験期間間の結果の比較を困難にします。

これを克服するために、ハノイ工科大学は、多くの国際試験で使用されている現代的な教育測定方法である、質問応答理論 - IRT(Item Response Theory)モデルを適用しています。
TSA試験は、質問の難易度と区別度を含む2つのパラメータのIRTモデルを使用しています。したがって、試験問題の各質問には、難易度と受験生を分類する能力を反映した独自のパラメータが割り当てられています。同時に、各受験生は、試験全体を通して特定の能力レベルを評価されます。
したがって、多くの難しい質問を正しく答えた受験生は点数で有利になります。一方、簡単な質問だけを正しく答えた受験生は点数が低くなります。
TSAにおける2つのパラメータを備えたIRT採点の4段階プロセス
IRT 2パラメータモデルによる採点プロセスは、4つのステップで実施されます。
ステップ1:受験生の解答データに基づいて、採点ソフトウェアは現在の試験問題の各質問の難易度と区別度を推定します。
ステップ2:採点ソフトウェアは、試験結果と現在の試験問題のスケールに基づいて、各受験生の思考能力のスコアを推定します。
ステップ3:現在の試験問題のスケールを、以前の試験と共通の参照スケールに変換して、受験生の思考能力のスケールを同じスケールに戻します。
ステップ4:参照した受験生の思考能力のスコアをTSAスケールに変換します。
ブー・ズイ・ハイ准教授・博士は、IRTによる採点は、点数が正解数だけでなく、解答全体に基づいた能力評価プロセスの結果に基づいているため、より正確で公平な評価に役立つと述べました。
同時に、試験問題の測定尺度は、同等性と公平性を確保するために、試験期間間の共通参照尺度に変換されます。
この測定モデルの適用は、入学選考の革新における進歩と見なされており、国際試験に近づいていますが、受験生は点数を比較する際に混乱を避けるために明確に理解する必要があります。