Το μακρύ ταξίδι της Τεχνητής Νοημοσύνης στη Μηχανική Λογισμικού

Φωτογραφία 65.jpg — Η Τεχνητή Νοημοσύνη αυτοματοποιεί τα πάντα και μπορεί να αντικαταστήσει τους προγραμματιστές. Φωτογραφία: Midjourney

Μια ομάδα ερευνητών μόλις δημοσίευσε έναν ολοκληρωμένο χάρτη των προκλήσεων που αντιμετωπίζει η τεχνητή νοημοσύνη (AI) στην ανάπτυξη λογισμικού και πρότεινε έναν ερευνητικό οδικό χάρτη για την περαιτέρω προώθηση του τομέα.

Φανταστείτε ένα μέλλον όπου η Τεχνητή Νοημοσύνη αναλαμβάνει αθόρυβα τις καθημερινές εργασίες ανάπτυξης λογισμικού: την αναδιαμόρφωση περίπλοκου κώδικα, τη μετεγκατάσταση παλαιών συστημάτων και την αναζήτηση συνθηκών φυλής, αφήνοντας τους μηχανικούς λογισμικού ελεύθερους να επικεντρωθούν στην αρχιτεκτονική συστημάτων, το σχεδιασμό και τα δημιουργικά προβλήματα που οι μηχανές δεν μπορούν ακόμη να λύσουν. Οι πρόσφατες εξελίξεις στην Τεχνητή Νοημοσύνη φαίνεται να φέρνουν αυτό το όραμα πιο κοντά.

Ωστόσο, μια νέα μελέτη επιστημόνων στο Εργαστήριο Επιστήμης Υπολογιστών και Τεχνητής Νοημοσύνης (CSAIL) - MIT και συνεργαζόμενων ερευνητικών ινστιτούτων έδειξε ότι: για να πραγματοποιήσουμε αυτό το μέλλον, πρέπει πρώτα να εξετάσουμε άμεσα τις πολύ πραγματικές προκλήσεις της εποχής μας.

«Πολλοί λένε ότι οι προγραμματιστές δεν χρειάζονται πλέον επειδή η Τεχνητή Νοημοσύνη μπορεί να αυτοματοποιήσει τα πάντα», δήλωσε ο Armando Solar-Lezama, καθηγητής ηλεκτρολογίας και επιστήμης υπολογιστών στο MIT, ανώτερος ερευνητής στο CSAIL και κύριος συγγραφέας της μελέτης. «Στην πραγματικότητα, έχουμε σημειώσει σημαντική πρόοδο. Τα εργαλεία που διαθέτουμε σήμερα είναι πολύ πιο ισχυρά από ό,τι ήταν πριν. Αλλά έχουμε ακόμη πολύ δρόμο να διανύσουμε για να αξιοποιήσουμε πλήρως τις δυνατότητες του αυτοματισμού».

Ο καθηγητής Armando Solar-Lezama υποστηρίζει ότι η δημοφιλής αντίληψη για τη μηχανική λογισμικού είναι ότι πρόκειται για μια εργασία παρόμοια με μια φοιτητική εργασία προγραμματισμού: πάρτε μια μικρή συνάρτηση και γράψτε κώδικα για να την χειριστείτε ή κάντε μια άσκηση τύπου LeetCode. Η πραγματικότητα είναι πολύ πιο περίπλοκη: από αναδιαμορφώσεις κώδικα για βελτιστοποίηση σχεδίων, έως μετεγκαταστάσεις μεγάλης κλίμακας με εκατομμύρια γραμμές κώδικα από COBOL σε Java που αλλάζουν ολόκληρη την τεχνολογική στοίβα μιας εταιρείας.

Η μέτρηση και η επικοινωνία παραμένουν δύσκολα προβλήματα

Οι βελτιστοποιήσεις κώδικα σε βιομηχανική κλίμακα —όπως οι τροποποιήσεις πυρήνα GPU ή οι βελτιώσεις πολλαπλών επιπέδων στη μηχανή Chrome V8— εξακολουθούν να είναι δύσκολο να αξιολογηθούν. Τα τρέχοντα benchmarks αφορούν κυρίως μικρά, συσκευασμένα προβλήματα. Η πιο πρακτική μέτρηση, το SWE-Bench, απλώς ζητά από ένα μοντέλο AI να διορθώσει ένα σφάλμα στο GitHub—μια άσκηση προγραμματισμού χαμηλού επιπέδου που περιλαμβάνει μερικές εκατοντάδες γραμμές κώδικα και ενδεχομένως εκθέτει δεδομένα, και αγνοεί ένα ευρύ φάσμα πραγματικών σεναρίων, όπως η ανακατασκευή με τη βοήθεια AI, ο προγραμματισμός ζευγών ανθρώπου-μηχανής ή οι επανεγγραφές συστημάτων υψηλής απόδοσης με εκατομμύρια γραμμές κώδικα. Μέχρι να επεκταθούν τα benchmarks για να καλύψουν αυτά τα σενάρια υψηλότερου κινδύνου, η μέτρηση της προόδου —και επομένως η επιτάχυνσή της— θα παραμείνει μια ανοιχτή πρόκληση.

Επιπλέον, η επικοινωνία ανθρώπου-μηχανής αποτελεί επίσης ένα σημαντικό εμπόδιο. Ο διδακτορικός φοιτητής Άλεξ Γκου - ο κύριος συγγραφέας - δήλωσε ότι προς το παρόν, η αλληλεπίδραση με την Τεχνητή Νοημοσύνη εξακολουθεί να είναι σαν «μια εύθραυστη γραμμή επικοινωνίας». Όταν ζητά από την Τεχνητή Νοημοσύνη να δημιουργήσει κώδικα, συχνά λαμβάνει πίσω μεγάλα, αδόμητα αρχεία, μαζί με μερικά απλά και προβληματικά σύνολα δοκιμών. Αυτό το κενό αντικατοπτρίζεται επίσης στο γεγονός ότι η Τεχνητή Νοημοσύνη δεν μπορεί να επωφεληθεί αποτελεσματικά από εργαλεία λογισμικού που είναι οικεία στους ανθρώπους, όπως προγράμματα εντοπισμού σφαλμάτων, στατικά αναλυτές κ.λπ.

Κάλεσμα για δράση από την κοινότητα

Οι συγγραφείς υποστηρίζουν ότι δεν υπάρχει μαγική λύση για αυτά τα προβλήματα και ζητούν προσπάθειες σε επίπεδο κοινότητας: δημιουργία δεδομένων που αντικατοπτρίζουν την πραγματική διαδικασία ανάπτυξης των προγραμματιστών (ποιος κώδικας να διατηρηθεί, ποιος κώδικας να αφαιρεθεί, πώς αναδιαμορφώνεται ο κώδικας με την πάροδο του χρόνου κ.λπ.), κοινά εργαλεία αξιολόγησης για την ποιότητα αναδιαμόρφωσης, την ανθεκτικότητα των ενημερώσεων κώδικα και την ακρίβεια μετάβασης στο σύστημα, και δημιουργία διαφανών εργαλείων που επιτρέπουν στην Τεχνητή Νοημοσύνη να εκφράζει αβεβαιότητα και να προσκαλεί την ανθρώπινη παρέμβαση.

Ο διδακτορικός φοιτητής Άλεξ Γκου βλέπει αυτό ως «έκκληση για δράση» για μεγάλης κλίμακας κοινότητες ανοιχτού κώδικα που κανένα εργαστήριο από μόνο του δεν μπορεί να προσφέρει. Η Solar-Lezama οραματίζεται την πρόοδο να έρχεται με μικρά, σταδιακά βήματα - «ερευνητικά ευρήματα που λύνουν ένα κομμάτι του προβλήματος κάθε φορά» - μετατρέποντας την Τεχνητή Νοημοσύνη από ένα «εργαλείο πρότασης κώδικα» σε έναν πραγματικό συνεργάτη μηχανικής.

«Γιατί έχει σημασία αυτό; Το λογισμικό αποτελεί ήδη το θεμέλιο των οικονομικών, των μεταφορών, της υγειονομικής περίθαλψης και σχεδόν κάθε καθημερινής δραστηριότητας. Αλλά η ανθρώπινη προσπάθεια να το κατασκευάσει και να το συντηρήσει με ασφάλεια γίνεται εμπόδιο», δήλωσε ο Gu. «Μια Τεχνητή Νοημοσύνη που μπορεί να κάνει τη δύσκολη δουλειά χωρίς να κάνει κρυφά λάθη θα απελευθέρωνε τους προγραμματιστές ώστε να επικεντρωθούν στη δημιουργικότητα, τη στρατηγική και την ηθική. Αλλά για να φτάσουμε εκεί, πρέπει να καταλάβουμε ότι η ολοκλήρωση ενός κώδικα είναι το εύκολο κομμάτι - το δύσκολο κομμάτι είναι όλα τα άλλα».

(Σύντομη μετάφραση από το MIT News)

Πηγή: https://vietnamnet.vn/hanh-trinh-dai-cua-ai-trong-ky-thuat-phan-mem-tu-dong-hoa-2426456.html