Polscy badacze opracowali duży model językowy LongLLaMA, który potencjalnie pozwoli obsługiwać 64 razy więcej tekstu niż ChatGPT. Model badaczy z UW, PAN i IDEAS NCBR został oparty na oprogramowaniu OpenLLaMA, stworzonym przez Meta - właściciela Facebooka. To osiągnięcie zapowiada nowy krok w rozwoju modeli językowych. Opublikowane wyniki odbiły się głośnym echem w środowisku badaczy IT. Publikacja na ten temat została przyjęta na prestiżową konferencję naukową NeurIPS 2023.
więcej