Φουντώνει η κουβέντα για τα δεδομένα που χρησιμοποιεί η OpenAI – Τα «καρφιά» της Google και οι κατηγορίες της Scarlett Johansson
Η OpenAI ενδέχεται να παραβίασε τους όρους και τις προϋποθέσεις του YouTube για να εκπαιδεύσει το μοντέλο της με την ονομασία «Sora» το οποίο μπορεί και μετατρέψει το κείμενο σε βίντεο, σύμφωνα με τον CEO της Google Sundar Pichai.
«Δηλαδή, αισθάνεστε ότι έχουν παραβιάσει τους όρους και τις προϋποθέσεις σας, ή αν το είχαν κάνει θα ήταν κάτι που δεν είναι σωστό;», ρώτησε ο αρχισυντάκτης του The Verge, Nilay Patel στη συνέντευξη με τον CEO της Google. «Ακριβώς, αυτό που λέτε είναι αλήθεια», ήταν η απάντηση του Pichai.
Στην ίδια συνέντευξη ο Pichai αποκάλυψε ότι το YouTube εξακολουθεί να «παρακολουθεί και να προσπαθεί να καταλάβει» πως η OpenAI έχει εκπαιδεύσει το Sora. «Κοιτάξτε, δεν γνωρίζουμε τις λεπτομέρειες, αλλά έχουμε κάποιους όρους και προϋποθέσεις και περιμένουμε από τους ανθρώπους που δημιουργούν ένα προϊόν να τους σεβαστούν», δήλωσε.
Τον Φεβρουάριο η OpenAI εντυπωσίασε τον τομέα της τεχνητής νοημοσύνης όταν παρουσίασε στον κόσμο το Sora. Το μοντέλο, που πήρε το όνομά του από την Ιαπωνική λέξη για τον «ουρανό», είναι ικανό να παράγει βίντεο υψηλής ποιότητας από μια απλή πρόταση κειμένου.
Η OpenAI δεν έχει δείξει μεγάλη προθυμία να δώσει λεπτομέρειες σχετικά με τα δεδομένα που χρησιμοποίησε για να εκπαιδεύσει το Sora. Η Chief Technology Officer της εταιρείας, Mira Murati, δήλωσε τον Μάρτιο στην Wall Street Journal ότι «χρησιμοποίησε δημόσια διαθέσιμα δεδομένα και κάποια δεδομένα με άδεια χρήσης».
Η Murati, ωστόσο, δεν έδωσε σαφή απάντηση όταν ερωτήθηκε αν η OpenAI έχει λάβει δεδομένα από πλατφόρμες όπως το Instagram και το YouTube. «Στην πραγματικότητα δεν είμαι σίγουρη γ’αυτό. Ξέρετε, αν ήταν δημόσια διαθέσιμα προς χρήση μπορεί να υπάρχουν και τέτοια δεδομένα. Αλλά δεν είμαι σίγουρη για κάτι τέτοιο», ήταν τα λόγια της.
«Ξεκάθαρη παραβίαση αν η OpenAI έκανε κάτι τέτοιο»
Τον περασμένο μήνα ο CEO του YouTube Neal Mohan, δήλωσε στο Bloomberg ότι ενώ δεν γνωρίζει αν η OpenAI έχει εκπαιδεύσει το Sora με βίντεο από την πλατφόρμα, θα ήταν «ξεκάθαρη παραβίαση» των όρων χρήσης, αν το έκανε.
«Όταν ένας δημιουργός ανεβάζει τη δουλειά του στην πλατφόρμα μας, έχει συγκεκριμένες προσδοκίες. Μια από αυτές είναι ότι οι όροι χρήσης θα τηρούνται», δήλωσε ο Mohan.
«Δεν επιτρέπεται να κατεβαίνουν αποσπάσματα ή ολόκληρα βίντεο, αυτό αποτελεί παραβίαση των όρων παροχής υπηρεσιών μας. Αυτοί οι κανόνες είναι ο “οδικός χάρτης” όσον αφορά το περιεχόμενο στην πλατφόρμα μας», κατέληξε.
Μεγάλο θέμα τα δεδομένα για την εκπαίδευση των μοντέλων AI
Τα προβλήματα που αντιμετωπίζει η OpenAI με το YouTube αντικατοπτρίζει τις προκλήσεις που συναντούν οι εταιρείες τεχνητής νοημοσύνης που έχουν ανάγκη τα δεδομένα για να εκπαιδεύσουν τα μοντέλα τους. Τον Οκτώβριο η νεοφυής AI, Anthropic που υποστηρίζεται από την Amazon, δήλωσε ότι χρησιμοποιεί δεδομένα που παράγει η ίδια για τις ανάγκες των μοντέλων της.
Το ζήτημα που έχει προκύψει με το YouTube δεν είναι το μοναδικό που έχει να αντιμετωπίσει η OpenAI αυτό το διάστημα. Τη Δευτέρα η διάσημη ηθοποιός, Scarlett Johansson δήλωσε σοκαρισμένη και εξοργισμένη όταν ανακάλυψε ότι νέος φωνητικός βοηθός της OpenAI ακουγόταν «τρομακτικά παρόμοιος» με τη φωνή της. Η σταρ του κινηματογράφου ανέφερε σε δήλωση της ότι πριν από λίγες ημέρες είχε αρνηθεί πρόταση του Sam Altman να παραχωρήσει τη φωνή της για το νέο φωνητικό βοηθό που περιλαμβάνεται στο GPT-4o.
Το νέο προϊόν που έγινε διαθέσιμο την περασμένη εβδομάδα έχει διάφορες φωνές. Πολλοί χρήστες στα social media ανέφεραν ότι μια από τις φωνές με το όνομα «Sky» ακουγόταν σαν τη Johansson από την ταινία «Her» όπου η ηθοποιός είναι η φωνή ενός ψηφιακού βοηθούν τεχνητής νοημοσύνης. Μάλιστα, μετά το ντόρο που δημιουργήθηκε, η OpenAI απέσυρε τη φωνή της «Sky».
«Πιστεύουμε ότι οι φωνές τεχνητής νοημοσύνης δεν πρέπει να μιμούνται σκόπιμα τη χαρακτηριστική φωνή μιας διασημότητας. Η φωνή της “Sky” δεν είναι απομίμηση της Scarlett Johansson, αλλά ανήκει σε μια άλλη επαγγελματία ηθοποιό», έγραψε η OpenAI στο blog της.