Table of Contents
「腕時計に話しかけたら、AIが流暢に答えてくれる」――SF映画でおなじみのあのシーンが、ついに現実になりつつあります。AIVtuber開発者のフルエレさん(@fluele_alpha)が、最新のApple Watch Series 11単体でローカルLLM(大規模言語モデル)との日本語会話に成功したと公開し、SNSで大きな話題になっています。iPhoneを必要とせず、ネット接続も不要。腕時計だけでAIと会話ができるという、文字どおり手のひらサイズの未来です。
今回の検証の全記録は、フルエレさんご自身のnoteで詳しく公開されています。記事の元情報はこちらからお読みいただけます。
【世界初?】Apple Watch単体でローカルLLMとの会話に成功!|フルエレ
Source: フルエレ|note
「腕時計だけでAIと会話したい」という夢
SiriやGoogleアシスタントに「今日の天気は?」と話しかけられる時代はすでに当たり前です。けれどフルエレさんが目指したのは、そんな短い命令ではなく、自分のAIパートナーと腕時計で普通に会話するという体験でした。
クラウドAPIを経由すれば技術的には簡単ですが、通信ラグや圏外の問題が残ります。「自分のAIパートナーの脳みそが、どこかのサーバーにある」という状態自体を避けたい、というのが今回の動機だったそうです。ネット接続なし、iPhoneなし、Apple Watch完全単体で動かす――それがフルエレさんの掲げたゴールでした。
【朗報】
AppleWatch単体でローカルLLMとの会話に成功!!🤖
モデルは超軽量で日本語対応しているLFM2.5-350M(Q4_K_M)を使用してみました!
簡単な会話なら普通に話せます!
スマホやPCがなくてもWatchだけでAIと会話できる時代が到来したぞ!
たぶん日本初だと信じたい!
世界初だったり…する…?🥺 pic.twitter.com/ZvaRAosTMd— フルエレ (@fluele_alpha) June 2, 2026
最初の壁は「Core ML」の罠とメモリ上限314MB
Apple Watchで機械学習モデルを動かす場合、まず思い浮かぶのはApple純正の「Core ML」を使い、Neural Engineに処理させる方法です。フルエレさんも当初はこの王道ルートを選びました。
使用したモデルは、日本語にも対応している軽量モデル「LFM2.5-350M」(3.5億パラメータ)。4bit量子化でディスクサイズを約191MBまで圧縮し、Apple Watch Series 11のアプリで使えるメモリ上限(独自検証で約314MB)にギリギリ収まる計算でした。
ところが、実機に転送して起動した瞬間に強制終了。原因を調べると、ディスクでは191MBだったはずのモデルが、Core MLで読み込んだ途端に約1.5GBまで膨れ上がっていたといいます。Core MLは実行時に4bitの重みをfp32(32bit浮動小数点)に展開する仕様で、「4bit=軽い」というのは、あくまでディスク上の話。実行時メモリは別物だったというわけです。
314MBのメモリ枠に1.5GBは絶対に入らない。一度は「Watch単体でLLMなんて無理だったんだ」と諦めかけたそうです。
逆転の一手「GGUF+llama.cpp」
それでも諦めきれなかったフルエレさんが次に注目したのが、AI界隈ではおなじみの「GGUF」形式と「llama.cpp」でした。llama.cppは、量子化した重みデータを展開せずにそのままRAMに保持し、さらにmmapという仕組みで必要な部分だけ読み込んでくれます。
そこでフルエレさんは、llama.cppをwatchOS向け(arm64/CPUバックエンドのみ/Metal無効)に自前でクロスコンパイル。BSD型がうまく解決できない問題やCMakeのトラブルなど、数々のビルドエラーを力技で突破し、Apple Watch用の静的ライブラリを完成させました。そしてGGUF化したモデル(Q4_K_M形式、約229MB)を同梱してApple Watchに実機インストールしたといいます。
結果:Apple Watchの中でAIが「動いた」
結果は成功。Apple Watchの画面に「私はLFM (Liquid Foundation Model) です。」という文章が、Watch単独で表示される瞬間が訪れました。
しかも、実測データもなかなか衝撃的です。
・モデルロード時の常駐メモリ:約129MB(Core MLの1.5GBから劇的に削減)
・生成中のピークメモリ:約267MB(上限314MBに対して、残り47MBで生存)
・生成速度:約16.7 tokens/sec(TTFT 約380ms)
Apple WatchのCPU推論だけで秒間約16トークン。マルチターンの会話(文脈を覚えて応答する)も成立しているとのことで、簡単な会話ならサクサクこなせるレベルに達しているそうです。クラウドに一切頼らず、Apple Watchの内側だけでLLMが日本語で応答する。これはたしかに、SF的な体験です。
意外な伏兵「iPhone 6s」が見せたA9チップの底力
今回の検証ではもう一つ、ガジェット好きにはたまらない比較データも公開されています。同じLFM2.5-350M(Q4_K_M)を10年前のスマートフォン「iPhone 6s」でも動かしたところ、生成速度は約14.00〜22.54 tokens/secを記録しました。
最新のApple Watch Series 11と、10年前のiPhone 6s(A9チップ搭載)のCPU性能がほぼ互角――それどころか、初速ではiPhone 6sのほうが速い場面もあるという結果に、フルエレさん自身も「A9チップ、オーパーツすぎる」と驚いています。最新技術を追いかけた結果、思わぬところで古いAppleデバイスの底力を再発見することになったのも、自作開発ならではのおもしろさです。
泥臭い開発の全記録は本人のnoteへ
失敗から逆転、そして実測データまで含めた今回の挑戦の全記録は、フルエレさんがnoteにまとめています。Core MLで1.5GBに膨れ上がって絶望した話や、iPhone 6sのA9オーパーツ伝説のくだりも詳しく書かれているので、技術的な背景に興味がある方はあわせて読んでみるのがおすすめです。
ここまでの泥臭い全記録(失敗→逆転→実測データ)をnoteにも同じくまとめました📝
Core MLで1.5GBに膨れて絶望した話とか、iPhone 6sがA9オーパーツだった話も書いてます👇【世界初?】Apple Watch単体でローカルLLMとの会話に成功!|フルエレ @fluele_alpha https://t.co/S8GPuWIAXp
— フルエレ (@fluele_alpha) June 2, 2026
【世界初?】Apple Watch単体でローカルLLMとの会話に成功!|フルエレからぜひ本文をご覧ください。
次なる目標であるWatch単体での音声認識(STT)や音声合成(TTS)の動向が気になる方は、フルエレさんのX(@fluele_alpha)もあわせてフォローしてみてください。
あわせて読みたい関連記事
Apple Watch Series 11の最新情報をまとめてチェックしたい方は、NEWSカテゴリーから最新ニュースを追ってみてください。
AIやスマートウォッチ業界の動向をじっくり読みたい方には、AI・生成AIカテゴリーの記事もおすすめです。
Apple Watch Series 11そのものの特徴や仕様をおさらいしたい方は、Apple Watch Series 11タグからまとめて読めます。
watchOSのアップデートや新機能を追いかけたい方は、watchOSタグもぜひチェックを。
ChatGPTや生成AIをスマートウォッチや日常で活用するヒントは、AI活用術タグにまとまっています。
Apple Watchの選び方や比較記事を探している方は、【2025年最新版】Apple Watch SE 3・Series 11・Ultra 3の違いを徹底比較もぜひあわせてどうぞ。
そのほかの記事はSmart Watch Lifeトップページからチェックできます。
はじめての方・記事の探し方に迷った方へ
記事が多くて迷ったら、
記事の探し方ガイド
から目的別に読めます。











