DeepSeekの技術にはいくつかポイントがありますが、AIにおける”aha moment”の観察を多くの人が取り上げています。DeepSeekの論文は、このような現象を最初に報告したものになるのではないかと思います。特に”aha moment”を学習に使ったわけではなく、学習後のAIの動作です。
”aha moment” は「なるほど、わかった!」ということで、アルキメデスにちなんで”Eureka effect”という別名もあるようです。
https://en.wikipedia.org/wiki/Eureka_effect
DeepSeek論文の報道機関による解説はいろいろあります。
https://www.ft.com/content/ea803121-196f-4c61-ab70-93b38043836e
技術者の解説もいろいろあり、下記がわかりやすいです。
https://qiita.com/ymgc3/items/45f2709be9b81d89d709
https://zenn.dev/wataru777/articles/b0e0e1989243a7
この解説の末尾に出てくるGoogle notebookLMというサービスは論文を読ませると要点を教えてくれるようです。使ってみようと思います。
https://news.mynavi.jp/techplus/article/20241214-3086257/
英語は https://www.ft.com/content/ea803121-196f-4c61-ab70-93b38043836e から。
reinforcement learning 強化学習 私が読んだ教科書では reinforced learningだったのですが、あっているのでしょうか?
with limited human intervention 人間の介入を制限して = to lessen human involvement
“producing “aha moment” that could transform the cost for developers to build killer applications based on the technology.”
この transformは 変革する、というような意味でしょう。
killer applications キラーアプリ
“together, these developments have sent shockwaves throughout Silicon Valley, as R1 outperforms some tasks compared with recently released models from OpenAI, Anthropic and Meta, but at a fraction of the money to develop.”
outperform 追い越す
at a fraction of the money to develop ほんのわずかな開発資金で
※ a fraction number で「分数」です。
”Despite the controversy, experts have said that DeepSeek demonstrated real innovation. AI researchers have also praised its willingness to publish a detailed technical report outlining how it built its reasoning model.”
despite ~にもかかわらず
controversy 議論
willingness 自発的に気前よくしてくれること
※ 私も同意見です。勉強になります。