Carol Anderson 10/29/22 Carol Anderson 10/29/22

Large language models can steal work and spill secrets. Here’s why we should care.

Large language models are trained on massive datasets of web-scraped data. They memorize some of it, and can regurgitate it verbatim – including personal data and copyrighted material. Is that a problem?