Lyria: Το πρωτοποριακό μοντέλο AI που υπόσχεται να «μεταμορφώσει» τη μουσική δημιουργία (vids)
Shutterstock
Shutterstock
Google DeepMind

Lyria: Το πρωτοποριακό μοντέλο AI που υπόσχεται να «μεταμορφώσει» τη μουσική δημιουργία (vids)

Η Google παρουσίασε τον περασμένο μήνα το Lyria, ένα νέο μοντέλο παραγωγής μουσικής με τη βοήθεια του Generative AI, επιβεβαιώνοντας εκ νέου τη δέσμευσή της να βρίσκεται στην πρώτη γραμμή της «κούρσας» της Τεχνητής Νοημοσύνης.

Το Gen AI («δημιουργική» Τεχνητή Νοημοσύνη), ο τύπος ΤΝ που υπόσχεται νέους ορίζοντες στην παραγωγή και δημιουργία περιεχομένου (βίντεο, ήχο, κείμενο, εικόνα και κώδικα), χρησιμοποιείται ήδη από τις εταιρίες που κατανοούν ότι η ΤΝ μπορεί να αποτελέσει ένα σημαντικό εργαλείο στα χέρια των επαγγελματιών, βοηθώντας τους να επικεντρωθούν σε πιο δημιουργικές εργασίες, δημιουργώντας όμως και ανησυχίες σχετικά με τις χρήσεις της.

Συγκεκριμένα υπάρχει μεγάλη ανησυχία σχετικά με τις δυνατότητες της ΤΝ να αντικαταστήσει τους ανθρώπους σε πολλές θέσεις εργασίας. Ωστόσο, η ΤΝ και ειδικά το Gen AI αποτελεί μια από τις μεγαλύτερες ευκαιρίες για τις επιχειρήσεις και τις κυβερνήσεις ώστε να ενισχύσει την ανθρώπινη δημιουργικότητα και να ξεπεράσει τις προκλήσεις του εκδημοκρατισμού της ΤΝ.

Με το Lyria, η Google DeepΜind υπόσχεται να «μεταμορφώσει το μέλλον της μουσικής δημιουργίας», παρουσιάζοντάς «το πιο προηγμένο μοντέλο δημιουργίας μουσικής και δύο νέα πειράματα Tεχνητής Nοημοσύνης», σχεδιασμένα με στόχο να γίνουν μια «παιδική χαρά για τη δημιουργικότητα».

Τι είναι το Generative AI;

Το Gen AI είναι ένας τύπος Τεχνητής Νοημοσύνης που μπορεί να δημιουργήσει ένα ευρύ φάσμα δεδομένων, όπως εικόνα, βίντεο, ήχο, κείμενο, κώδικα και τρισδιάστατα μοντέλα. Αυτό, το επιτυγχάνει μαθαίνοντας μοτίβα (μηχανική εκμάθηση - machine learning) από τα υπάρχοντα δεδομένα και στη συνέχεια χρησιμοποιώντας αυτή τη γνώση για τη δημιουργία νέων και μοναδικών αποτελεσμάτων. 

H «generative» ΤΝ μπορεί να παράγει εξαιρετικά ρεαλιστικό και πολύπλοκο περιεχόμενο που μιμείται ανθρώπινες δημιουργίες, καθιστώντας την πολύτιμο εργαλείο για πολλούς κλάδους. Πρόσφατες ανακαλύψεις στον τομέα, όπως το ChatGPT ή άλλα chatbots όπως το Bard και το πρόσφατο Gemini, έχουν αναδείξει νέες προοπτικές στη χρήση του Gen AI για την επίλυση σύνθετων προβλημάτων, την τέχνη και τη δημιουργία αυτής, αλλά και στην επιστημονική έρευνα, εξαιτίας της απίστευτης δυνατότητάς της να αναλύσει στοιχεία.

Τι είναι το Lyria, το νέο εργαλείο της Google Deepmind

«Από την τζαζ μέχρι τη χέβι μέταλ, από την τέκνο μέχρι την όπερα, η μουσική είναι μια πολύ αγαπητή μορφή δημιουργικής έκφρασης. Με πολύπλοκους και πολυσύνθετους στίχους, μελωδίες, ρυθμούς και φωνητικά, η δημιουργία συναρπαστικής μουσικής αποτελούσε ιδιαίτερη πρόκληση για τα συστήματα ΑΙ μέχρι τώρα», αναφέρει η Google.

Η εταιρία ανακοίνωσε ότι, σε συνεργασία με το YouTube, λανσάρει το Lyria της Google DeepMind, «το πιο προηγμένο μοντέλο δημιουργίας μουσικής» προερχόμενο από την ΤΝ, καθώς και δύο «Πειράματα ΤΝ».

Το Lyria είναι ένα μοντέλο που εκπαιδεύτηκε από ερευνητές της DeepMind σε ένα σύνολο μουσικών δεδομένων για τη δημιουργία υψηλής πιστότητας οργανικών κομματιών καθώς και φωνών. Βασίζεται σε προηγούμενα μοντέλα μουσικής AI της DeepMind, αλλά έχει μεγαλύτερη μουσική κατανόηση, κάτι που του επιτρέπει να παράγει μουσική που θυμίζει περισσότερο σε ανθρώπινες δημιουργίες.

Dream Track

Πρόκειται για ένα πείραμα στο YouTube Shorts που έχει σχεδιαστεί για να βοηθήσει τους καλλιτέχνες να εμβαθύνουν τις μεταξύ τους σχέσεις αλλά και αυτές που διατηρούν με το κοινό τους, μέσω της μουσικής δημιουργίας.

Music AI Tools 

Ένα σύνολο εργαλείων που σχεδιάζει η DeepMind με καλλιτέχνες, συνθέτες και παραγωγούς για να συμβάλλει στην ενίσχυση της δημιουργικότητας τους.

«Για την ανάπτυξη αυτών των έργων, συγκεντρώσαμε τεχνικούς εμπειρογνώμονες από όλη την Google με ένα ευρύ φάσμα παγκοσμίου φήμης καλλιτεχνών και τραγουδοποιών για να διερευνήσουμε πώς οι τεχνολογίες δημιουργικής μουσικής μπορούν να διαμορφώσουν υπεύθυνα το μέλλον της μουσικής δημιουργίας», αναφέρει η Google.

Το Lyria στοχεύει στη δημιουργία μουσικής υψηλής ποιότητας 

Το μοντέλο Lyria έχει σχεδιαστεί για τη δημιουργία μουσικής υψηλής ποιότητας με συνοδεία οργάνων και φωνητικά. Σύμφωνα με το Google Deepmind, το Lyria υποστηρίζει πολλά είδη, ενώ η εταιρεία λέει ότι μπορεί να διατηρήσει την πολυπλοκότητα των ρυθμών, των μελωδιών και των φωνητικών σε φράσεις, στίχους ή μεγάλα μουσικά κομμάτια.

Το Google Deepmind δοκιμάζει το Lyria με το YouTube στο πλαίσιο του Dream Track. Στόχος του πειράματος είναι να εξερευνήσει νέους τρόπους με τους οποίους οι καλλιτέχνες μπορούν να δημιουργήσουν μουσική. Οι χρήστες εισάγουν ένα θέμα και ένα στυλ στο «περιβάλλον» του μοντέλου, επιλέγουν έναν καλλιτέχνη από το καρουζέλ και δημιουργούν ένα soundtrack 30 δευτερολέπτων για μια ταινία μικρού μήκους στο YouTube.

Το Lyria παράγει τους στίχους, τη μουσική υπόκρουση και τη φωνή που παράγει η ΤΝ στο στυλ του επιλεγμένου καλλιτέχνη που συμμετέχει. Ανάμεσα στους καλλιτέχνες είναι οι Alec Benjamin, Charlie Puth, Charli XCX, Demi Lovato, John Legend, Sia, T-Pain, Troye Sivan και Papoose.

Επίσης, οι ερευνητές του DeepMind συνεργάζονται με καλλιτέχνες, συνθέτες και παραγωγούς από το YouTube Music AI Incubator για να διερευνήσουν πώς το Gen AI μπορεί να συνεισφέρει στη δημιουργική διαδικασία.

Μαζί, αναπτύσσουν μια σειρά από εργαλεία που μπορούν να μετατρέψουν τον ήχο από ένα μουσικό στυλ ή όργανο σε ένα άλλο, να δημιουργήσουν ορχηστρικές και φωνητικές συνοδείες και να δημιουργήσουν νέα μουσική ή ορχηστρικά κομμάτια από το μηδέν.

Τα εργαλεία έχουν σχεδιαστεί για να διευκολύνουν τους καλλιτέχνες να μετατρέπουν τις ιδέες τους σε μουσική, όπως για παράδειγμα να δημιουργούν παρτιτούρες για κιθάρα από ήχο προερχόμενο από «σιγοτραγούδισμα».

«Watermark» στον ήχο AI από το SynthID της Deepmind

Όλο το περιεχόμενο που παράγεται με το Lyria έχει το υδατογράφημα του SynthID, η τεχνολογική εργαλειοθήκη που χρησιμοποιείται για την αναγνώριση εικόνων AI που παράγονται από το Imagen στο Vertex AI του Google Cloud. Το υδατογράφημα είναι ορατό στις μηχανές, αλλά όχι στους ανθρώπους.

Παρομοίως, ο ήχος που παράγεται από ΑΙ θα φέρει ένα ηχητικό υδατογράφημα που δεν μπορεί να ακούσει το ανθρώπινο αυτί και δεν επηρεάζει την εμπειρία ακρόασης. 

Το υδατογράφημα θα παραμένει αναγνωρίσιμο ακόμη και αν το ηχητικό υλικό τροποποιηθεί, για παράδειγμα με την προσθήκη θορύβου, συμπίεσης MP3 ή επιτάχυνσης/επιβράδυνσης του κομματιού, αναφέρει η DeepΜind.

Πριν από λίγες ημέρες, το YouTube δημοσίευσε νέους κανόνες για την αντιμετώπιση του οπτικοακουστικού περιεχομένου που δημιουργείται από ΤΝ στην πλατφόρμα. Μεταξύ άλλων, η πλατφόρμα βίντεο εστιάζει σε αυξημένες απαιτήσεις επισήμανσης και θέλει το περιεχόμενο AI να αναγνωρίζεται τόσο από ανθρώπους όσο και από AI.

Στόχος η ενίσχυση και όχι η αντικατάσταση της ανθρώπινης δημιουργικότητας

Αυτές οι συνεργασίες καταδεικνύουν την έμφαση που δίνει η DeepMind στην ανάπτυξη του Lyria με υπευθυνότητα και σε συνεργασία με τη μουσική βιομηχανία.

Τα Music AI Tools απευθύνονται περισσότερο σε μουσικούς παραγωγούς, καλλιτέχνες και συγγραφείς τραγουδιών, ενώ το Dream Track πιστεύεται ότι θα είναι ιδανικό για ανεξάρτητους δημιουργούς και influencers που δημιουργούν βίντεο μικρού μήκους.

Οι δύο αυτές καινοτομίες που προσφέρει το νέο μοντέλο της Google DeepMind έχουν στόχο να ενισχύσουν και όχι να αντικαταστήσουν την ανθρώπινη δημιουργικότητα, σε μια προσπάθεια εκδημοκρατισμού των εργαλείων του Gen AI στον τομέα της μουσικής, καλύπτοντας ένα σημαντικό φάσμα στυλ και φωνητικών.

Οι ερευνητές αναγνωρίζουν την ανάγκη να αναπτυχθεί προσεκτικά η τεχνολογία αυτή και υπόσχονται να συνεχίσουν να συνεργάζονται στενά με τους μουσικούς και την καλλιτεχνική κοινότητα ώστε να μεγιστοποιήσουν τα οφέλη της και ταυτόχρονα να μετριάσουν τους κινδύνους που μπορεί να συνδέονται τη χρήση της ΤΝ, εάν δεν υπάρχει το σωστό ρυθμιστικό πλαίσιο.

Πολλοί καλλιτέχνες έχουν ανησυχήσει από τον αυξανόμενο αριθμό μουσικών εργαλείων τεχνητής νοημοσύνης και η DeepMind φαίνεται να το γνωρίζει αυτό, επιλέγοντας να συνεργαστεί με πραγματικούς καλλιτέχνες της βιομηχανίας.