Разработан метод быстрого "сжатия" аналогов ChatGPT
С помощью подхода можно быстро квантизировать большие языковые модели, что позволит использовать их не только на серверах, но и на телефонах и прочих устройствах с ограниченным объемом памяти, сообщили в пресс-службе "Яндекс образования" tass.ru »