2023-07-27から1日間の記事一覧

計算したい(4) 6825726.47 msのお説教

70Bモデルのloadを試してみたが、 error loading model: llama.cpp: tensor 'layers.0.attention.wk.weight' has wrong shape; expected 8192 x 8192, got 8192 x 1024 となって、いまのところうまくいかず。Mac studioならロードできるのだったら即買いして…

本ブログではamazon associate広告を利用しています。