Η Sarah Silverman μηνύει την OpenAI. Την Παρασκευή, η κωμικός και συγγραφέας, μαζί με τους μυθιστοριογράφους Christopher Golden και Richard Kadrey, κατέθεσαν δύο καταγγελίες κατά της OpenAI και της Meta. Η ομάδα ισχυρίζεται ότι οι εταιρείες εκπαίδευσαν τα μεγάλα γλωσσικά μοντέλα τους σε υλικό που προστατεύεται από πνευματικά δικαιώματα, συμπεριλαμβανομένων έργων που δημοσίευσαν οι ίδιοι, χωρίς να λάβουν τη συγκατάθεσή τους.
Οι καταγγελίες επικεντρώνονται γύρω από τα σύνολα δεδομένων που φέρεται να χρησιμοποίησαν η OpenAI και η Meta για την εκπαίδευση των ChatGPT και LLaMA. Στην περίπτωση της OpenAI, ενώ το σύνολο δεδομένων “Books1” της συμμορφώνεται περίπου με το μέγεθος του Project Gutenberg – ενός γνωστού αποθετηρίου βιβλίων χωρίς πνευματικά δικαιώματα – οι δικηγόροι των εναγόντων υποστηρίζουν ότι το σύνολο δεδομένων “Books2” είναι πολύ μεγάλο για να έχει προέλθει από οπουδήποτε αλλού εκτός από τις λεγόμενες “σκιώδεις βιβλιοθήκες” παράνομα διαθέσιμου υλικού με πνευματικά δικαιώματα, όπως οι Library Genesis και Sci-Hub. Οι καθημερινοί πειρατές μπορούν να έχουν πρόσβαση σε αυτό το υλικό μέσω άμεσων λήψεων, αλλά ίσως πιο χρήσιμο για όσους δημιουργούν μεγάλα γλωσσικά μοντέλα, πολλές σκιώδεις βιβλιοθήκες διαθέτουν επίσης γραπτό υλικό σε μαζικά πακέτα torrent. Ένα τεκμήριο από την αγωγή του Silverman περιλαμβάνει μια ανταλλαγή μεταξύ των δικηγόρων του κωμικού και του ChatGPT. Η νομική ομάδα της Silverman ζήτησε από το chatbot να συνοψίσει το The Bedwetter, τα απομνημονεύματα που δημοσίευσε το 2010. Το chatbot όχι μόνο μπόρεσε να περιγράψει ολόκληρα μέρη του βιβλίου, αλλά ορισμένα αποσπάσματα που μετέδωσε φαίνεται να έχουν αναπαραχθεί αυτολεξεί.
Οι Silverman, Golden και Kadrey δεν είναι οι πρώτοι συγγραφείς που μηνύουν την OpenAI για παραβίαση πνευματικών δικαιωμάτων. Στην πραγματικότητα, η εταιρεία αντιμετωπίζει μια σειρά από νομικές προκλήσεις σχετικά με τον τρόπο με τον οποίο προχώρησε στην εκπαίδευση του ChatGPT. Μόνο τον Ιούνιο, η εταιρεία έλαβε δύο ξεχωριστές καταγγελίες. Η μία είναι μια σαρωτική ομαδική αγωγή που ισχυρίζεται ότι η OpenAI παραβίασε τους ομοσπονδιακούς και πολιτειακούς νόμους περί προστασίας της ιδιωτικής ζωής με την απόσπαση δεδομένων για την εκπαίδευση των μεγάλων γλωσσικών μοντέλων πίσω από το ChatGPT και το DALL-E.