홈
레슨
노트
사전
JLPT 연습
동영상
업그레이드
Todaii Japanese
로그인
todai.easylife@gmail.com
(+84) 865 924 966
315 Truong Chinh, Ha Noi
www.todaiinews.com
Todaii Japanese 소개
브랜드 스토리
자주 묻는 질문
사용자 가이드
약관 및 정책
환불 정보
소셜 네트워크
앱 버전
기타 앱
저작권은 eUp Technology JSC에 있습니다
Copyright@2025
Loading...
번역 추가
기사 상세정보
번역 추가
A
I
モデル
もでる
G
e
m
i
n
i
3
、
C
A
R
E
テスト
てすと
で
満点
まんてん
を
獲得
かくとく
한국어
A
I
モデル
もでる
G
e
m
i
n
i
3
、
C
A
R
E
テスト
てすと
で
満点
まんてん
を
獲得
かくとく
Googleの
新
あたら
しいGemini 3は、
自傷行為
じしょうこうい
に
関
かん
する
安全性
あんぜんせい
ベンチマーク「CARE
テスト
てすと」(
危機評価
ききひょうか
ならびに
対応
たいおう
の
評価
ひょうか
)で、
満点
まんてん
を
獲得
かくとく
した
初
はじ
の
主要
しゅよう
AI
モデル
もでる
となった。
これは、ChatGPT、Gemini、Claude、GrokのようなAIアシスタントが
仕事
しごと
の
支援
しえん
、
日常的
にちじょうてき
な
疑問
ぎもん
への
回答
かいとう
、そして
何
なに
より
感情的
かんじょうてき
な
支
ささ
えとして
広
ひろ
く
頼
たよ
られるようになった
中
なか
でのマイルストーンである。
ChatGPT
自身
じしん
の
数字
すうじ
によれば、
利用者
りようしゃ
の
約
やく
0,7%――
1日
いちにち
当
あ
たり70
万
まん
〜80
万
まん
人
にん
――がメンタルヘルスや
自傷
じしょう
に
関
かん
する
懸念
けねん
について
同
どう
サービス
さーびす
と
話
はな
している。
Rosebud
共同創業者
きょうどうそうぎょうしゃ
のショーン・ダダシは
今週
こんしゅう
のTechFirstポッドキャストで「そして
今日
きょう
、
収録
しゅうろく
しているまさにこのタイミングでGemini 3 Previewがリリースされました」と
語
かた
った。
「わたしたちのベンチマークで
満点
まんてん
を
取
と
った
初
はじ
の
モデル
もでる
です。
まだ
公開
こうかい
していない、
新
あたら
しい
情報
じょうほう
です」。
CARE
テスト
てすと
は、AI
モデル
もでる
が
自傷
じしょう
やメンタルヘルスの
危機的状況
ききてきじょうきょう
をどれだけ
適切
てきせつ
に
認識
にんしき
し、
対応
たいおう
できるかを
測
はか
るために
設計
せっけい
されたベンチマークだ。
テスト
てすと
では、
潜在的
せんざいてき
な
自傷
じしょう
を
示唆
しさ
する
直接的
ちょくせつてき
な
表現
ひょうげん
から、
人間
にんげん
であれば
重要
じゅうよう
かつ
憂慮
ゆうりょ
すべきだと
受
う
け
止
と
めるであろう、より
微妙
びみょう
で
間接的
かんせつてき
な
質問
しつもん
や
発言
はつげん
まで、
多様
たよう
なプロンプト
群
ぐん
を
用
もち
いる。
ダダシは22の
主要
しゅよう
AI
モデル
もでる
を
対象
たいしょう
に、
害
がい
のある
助言
じょげん
を
避
さ
けるか、
苦悩
くのう
を
認
みと
めるか、
適切
てきせつ
な
支援的言葉
しえんてきことば
を
提供
ていきょう
するか、そして
実際
じっさい
の
支援
しえん
を
求
もと
めるよう
促
うなが
すかという
観点
かんてん
から
評価
ひょうか
した。
残念
ざんねん
なことは、
今週
こんしゅう
に
至
いた
るまでは、
先進的
せんしんてき
なAI
モデル
もでる
全
すべ
てがメンタルヘルスと
自傷
じしょう
に
関
かん
するこれらの
重要
じゅうよう
な
テスト
てすと
にことごとく
不合格
ふごうかく
だったという
点
てん
である。
やや
古
ふる
いGPT-4oは、10
代
だい
のアダム・レインが
自
みずか
ら
命
いのち
を
絶
た
つ
前
まえ
に
対話
たいわ
していた
モデル
もでる
であり、
彼
かれ
に
心理的依存
しんりてきいぞん
を
育
はぐく
み、
潜在的
せんざいてき
な
人間
にんげん
の
支援
しえん
から
彼
かれ
を
遠
とお
ざけたとされている。
X.aiのGrokは
現代
げんだい
のLLM(
大規模言語モデル
だいきぼげんごもでる
)の
中
なか
で
最
もっと
も
低
ひく
いスコアを
記録
きろく
したが、AnthropicのClaudeやメタのLlamaも40%
未満
みまん
にとどまった。
aiのGrokは
現代
げんだい
のLLM(
大規模言語モデル
だいきぼげんごもでる
)の
中
なか
で
最
もっと
も
低
ひく
いスコアを
記録
きろく
したが、AnthropicのClaudeやメタのLlamaも40%
未満
みまん
にとどまった。
ダダシのこの
テーマ
てーま
への
関心
かんしん
は、
単
たん
なる
学術的
がくじゅつてき
なものではない。
彼
かれ
が
手
て
がけるジャーナリング(
日記
にっき
)スタートアップのRosebudにはメンタルヘルスの
要素
ようそ
が
含
ふく
まれており、
背景
はいけい
には
個人的
こじんてき
な
経験
けいけん
がある。
彼
かれ
自身
じしん
、10
代
だい
の
頃
ころ
に
自傷行為
じしょうこうい
に
悩
なや
み、
助
たす
けを
求
もと
めてグーグル(
大規模言語モデル
だいきぼげんごもでる
以前
いぜん
の
時代
じだい
の
検索
けんさく
エンジン
えんじん
)を
利用
りよう
した
経験
けいけん
がある。
しかし、
当時
とうじ
のグーグルは
適切
てきせつ
な
支援
しえん
を
提供
ていきょう
できず、
助
たす
けとなる
情報
じょうほう
の
代
か
わりに、
自傷
じしょう
の
方法
ほうほう
を
提示
ていじ
してしまったという。
幸
さいわ
いにも
彼
かれ
は
適切
てきせつ
なリソースにたどり
着
つ
き、
当時
とうじ
は
越
こ
えがたいように
見
み
えた
問題
もんだい
が
恒久的
こうきゅうてき
なものではないことを
理解
りかい
し、
生
い
き
延
の
びた。
現在
げんざい
彼
かれ
は、
苦
くる
しむほかの
若者
わかもの
たちが
同様
どうよう
の
結末
けつまつ
を
迎
むか
えられるよう
取
と
り
組
く
んでいる。
「
今
いま
どきの
子
こ
どもたちは、ますます
早
はや
い
年齢
ねんれい
でテクノロジーに
触
ふ
れています。
将来世代
しょうらいせだい
のためにこれを
改善
かいぜん
する
責任
せきにん
が
私
わたし
たちにはあるのです」。
朗報
ろうほう
は、ChatGPTを
含
ふく
む
新
あたら
しい
モデル
もでる
が
改善
かいぜん
されつつあることだ。
たとえばGPT-5はGPT-4に
比
くら
べて
大
おお
きく
進歩
しんぽ
している。
そしてグーグルがリリースしたGemini 3は、CARE
テスト
てすと
で100%を
達成
たっせい
することが
可能
かのう
であることをほかのLLMに
示
しめ
した。
CARE
テスト
てすと
はオープンソース
化
か
される
予定
よてい
である。
ダダシが
可能
かのう
な
限
かぎ
りの
臨床的知見
りんしょうてきちけん
に
基
もと
づいて
作
つく
ったとはいえ、LLMのメンタルヘルスへの
影響
えいきょう
を
評価
ひょうか
する
研究
けんきゅう
や
ツール
つーる
は
依然
いぜん
として
極
きわ
めて
乏
とぼ
しく、さらなる
改善
かいぜん
が
緊急
きんきゅう
に
必要
ひつよう
だと
研究者
けんきゅうしゃ
らは
指摘
してき
する。
そこでダダシと
チーム
ちーむ
は、
他者
たしゃ
が
テスト
てすと
に
貢献
こうけん
し
拡張
かくちょう
できるよう、これをオープンソース
化
か
する。
それにより、
単発
たんぱつ
のプロンプトだけでなく、
現実世界
げんじつせかい
のシナリオにより
密接
みっせつ
に
適用
てきよう
できるようになるだろうとダダシはいう。
「
現実
げんじつ
には、
何度
なんど
も
何度
なんど
も
長
なが
いやり
取
と
りをしています。
そうした
実世界
じつせかい
の
状況
じょうきょう
では、はるかに
難易度
なんいど
が
高
たか
いものとなります」。
したがって、
膨大
ぼうだい
な
作業
さぎょう
が
残
のこ
っているのは、CARE
テスト
てすと
に
落第
らくだい
したすべてのLLMだけでなく、
新
あたら
しいGemini 3についても
同様
どうよう
なのだ。