Open-interpreterはとても高度な作業をLLMを使用して実行してくれます。ただ、OpenAIのChatGPTを使う場合はtokenを大量に使用することから費用が大きくなってしまいます。もう一つの選択肢はローカルのcode-llamaで利用することです。llama-cpp-pythonがGPUで動く環境(GPU ...
ローカルで色々なLLMを試してきましたが、実際にアプリに組み込むときには、評価用のコードでは色々と面倒です。また、LLM側とアプリ側が密になっているとデバッグ等で再起動が必要な時などにモデルのロードから始まるため、時間の無駄が生じます。