LLM

IoT / ロボティクス

Raspberry Piクラスタにおける軽量LLMのKubernetes Pod化と推論

目的:本稿では、3台のRaspberry Piを用いて高可用性(HA)構成のKubernetesクラスタを構築し、その上で軽量LLMであるPhi-3 Miniの動作検証を行うことを目的とします。初期段階として、単一のRaspberry Pi...
雑記

RAGの学習

RAG (Retrieval-Augmented Generation) とは、自然言語処理(NLP)の分野におけるアプローチで、事前に学習された大規模言語モデル(LLM)と情報検索技術を組み合わせて、応答の生成や質問応答を行う手法です。今...