Liem氏はまた、AI分野におけるVNPTの科学技術開発のマイルストーンについても言及し、通常は最近、MICCAI、EMNLP、ICASSPなどのAIに関する世界有数の会議で研究プロジェクトが発表されている…これは、VNPTが数十億のユーザーリクエストを処理する規模で、数千万人のベトナム人にサービスを提供する「Make in Vietnam」エコシステムを開発するための基盤の1つであると述べた。
ベトナムに特化したAIはベトナムデータからスタート
医療においては、誤った診断や診断の遅れが治療の質、費用、患者の心理に影響を与える可能性があります。甲状腺がんなどの病気は静かに進行することが多く、ベトナムでは、特に下級医療施設の専門医や診断機器の数が限られています。その現実から、VNPT エンジニアリング チームはハノイ中央内分泌病院の医師と連携し、ベトナム向けに特化した超音波画像から甲状腺がんの診断を支援する AI を開発する研究を実施しました。最近、この研究結果は、2025年9月23日から27日まで韓国で開催されるMICCAI 2025会議で発表されました。これは、医療における AI とコンピューター ビジョンに関する主要な国際会議であり、AI テクノロジーを使用した医療画像の分析に焦点を当てています。

具体的には、この研究は甲状腺がんの診断に AI を適用することに焦点を当てており、4 年間にわたって国内の 3 つの地域で約 10,000 人の患者のデータを使用して実施されました。データセットは一流の専門家や医師によってラベル付けされ、病理組織学によって認証され、臨床的信頼性を確保するために標準化された形式です。
この研究は、国内の特定の人口や病状に適した自動診断支援システム開発の基盤となり、精度の向上、診断時間の短縮、医師の負担軽減、質の高い医療サービスの草の根レベルへのアクセス拡大に貢献します。大規模かつ高度な標準化により、このプロジェクトは医療画像診断における AI モデルのトレーニングおよび評価データの重要なソースとなり、ベトナムにおける甲状腺病変の検出および分類の精度向上に貢献します。
ベトナム語を世界の言語処理 AI マップに載せる
英語や中国語などの人気のある言語は豊富なデータソースを持っていますが、ベトナム語は依然としてリソースが限られた言語のグループに属しており、言語AIモデルの開発がより困難になっています。標準化されたデータが不足しているため、今日でも多くのチャットボット システムや仮想アシスタントでは、ベトナム語でコミュニケーションする際に、正しい文脈を理解できず、ぎこちなく不自然な表現をするという経験が依然として生じています。その現実に直面して、VNPT の AI エンジニアはベトナム語と感情モデルの研究と開発に注力してきました。これらの研究は、2025年11月4日から9日まで中国で開催される自然言語処理(NLP)に関する世界A*クラスのAIカンファレンスであるEMNLP 2025カンファレンスでもチームによって発表された。
これらの研究では、大規模言語モデル (LLM) と生成 AI (Generative AI) の開発に高度な機械学習技術を適用し、複雑な要素であり、国際的なコーパスではほとんどモデル化されていないベトナムの文脈、感情、ニュアンスを理解する AI モデルの能力を向上させています。そのおかげで、ベトナム語は世界的な NLP 研究コミュニティにおいてますます明確に存在するようになり、アイデンティティに富み、ベトナム人に適した強力な言語モデルを構築する可能性が開かれています。

同時に、2025年4月6日から11日までインドで開催されるICASSP 2025(AI音声処理に関するカンファレンスでA1ランク)において、VNPTの研究チームは、ドメイン敵対的トレーニングを組み合わせた音声変換技術研究プロジェクトを紹介した。この技術は、トレーニングデータが小さいか大きい場合でも、ベトナム語の音声特性を安定に保つようにモデルが学習するのに役立つ技術である。さまざまな情報源から。そのおかげで、システムはより自然で人間のような音声を作成し、各ユーザーに合わせて柔軟にカスタマイズして、よりパーソナライズされたフレンドリーなコミュニケーション体験をもたらすことができます。
このテクノロジーが実際に適用されると、多くのシステムが現在直面している大きな制限、つまり AI の音声が単調で感情に欠け、「機械的」であるという大きな制限が克服され、ユーザーが AI と対話する際により親密で信頼できると感じることができるようになります。
科学知識から国家技術力へ
国際的に公開された研究成果は、VNPT の AI バリュー チェーンにおける重要な中間ステップであり、科学的知識が実用的な製品に変換されます。上記のモデルとデータセットは現在、ベトナム語の音声認識、交通、ヘルスケア、行政の仮想アシスタント、そして最近では銀行や金融部門の AI エージェントなど、多くの分野で応用されています。

これらの AI エージェントは、ベトナム語モデリングと会話コンテキスト理解テクノロジーの基盤に基づいて構築されており、顧客サポート プロセスの自動化、金融商品コンサルティング、トランザクション認証のサポート、および金融および銀行部門で特に重要な要素であるデータ セキュリティとコンプライアンスの高い要件の確保に役立ちます。
VNPTを含むベトナムの科学チームが国際会議で発表した研究プロジェクトは、国内の研究能力が徐々に世界基準に近づいていることを示している。さらに重要なことは、これはベトナム国民自身のデータ、言語、知識に基づいて主権を持ってAI技術を習得する能力を形成するという国のより大きな目標への第一歩であるということだ。
●MICCAI (医用画像コンピューティングおよびコンピュータ支援介入に関する国際会議) – 医用画像コンピューティングとコンピュータ支援介入に焦点を当てた、医療における AI とコンピュータ ビジョンに関する一流の権威ある国際会議。 CORE 2023 ランキングによると、MICCAI はアプライド コンピューティングおよびコンピューター ビジョン / マルチメディアの分野で A にランクされています。
●ICASP(IEEE International Conference on Acoustics, Speech, and Signal Processing) – 50年以上の歴史を持つIEEEが毎年主催する、信号、音声、音声処理に関するA1にランクされる権威ある国際会議。
● EMNLP (自然言語処理における経験的手法に関する会議) – 自然言語処理 (NLP) に関する一流の権威ある国際会議であり、その経験的アプローチと厳格な採択率が特徴です。 NLP の分野では、EMNLP が A* と評価された主要なカンファレンスです。