שימוש בתכנים מוגנים

על מנת לאמן מערכות בינה מלאכותית נדרשים מאגרי נתונים רחבי היקף הרלבנטיים לתוצר הנדרש. תכנים אלה כוללים במקרים רבים, תכנים מוגנים בזכויות יוצרים, לרבות תמונות, טקסטים, יצירות והקלטות מוסיקליות, המשמשים לאימון המכונה. דיני זכויות  יוצרים, מגבילים, ככלל, את הזכות לעשות שימוש בתכנים שנוצרו על ידי אדם אחר, ומכאן מתעוררת שאלה לגבי ההסכמה של היוצרים / בעלי הזכויות ביצירות לשימוש ביצירותיהם לצרכי למידת מכונה. אל מול ההגבלות האמורות, המצדדים בשימוש מעין זה, סבורים שגישה חופשית למידע נדרשת עבור הטכנולוגיה, אשר לומדת בצורה דומה לבני האדם, ושהדבר ייטיב עם החברה בכללותה ויתרום לפיתוח הקידמה. הנושא מעלה שאלות מורכבות בדבר האיזון  הראוי בין שיקולים מתנגשים אלה.

 

לאור האמור, מדינות אחדות כבר תיקנו את חוק זכות יוצרים והוסיפו בו סעיף המתיר ניצול יצירה לצורך כריית מידע וטקסט Text & Data Mining (TDM). כך לדוגמא, בשנת 2018, יפן היתה המדינה החלוצה בהתרת שימוש זה, ללא צורך ברישיון, ללא תשלום ליוצר וללא צורך במתן קרדיט ליוצר. בשנת 2019,  התקבלה באיחוד האירופי הדירקטיבה המוכרת כ- DSM ונקבעו בה שני הסדרים המתירים שימוש ביצירות מוגנות לצורךTDM .

 

כפי שציינו בניוזלטר קודם, בישראל, משרד המשפטים פרסם בשנת 2022 חוות דעת העוסקת בנושא זה: https://www.gov.il/BlobFolder/legalinfo/machine-learning/he/machine-learning.pdf על פי משרד המשפטים הישראלי, העדר הבהירות בנוגע לחוקיות השימוש בחומרים המוגנים בזכויות יוצרים למטרות פיתוח בינה מלאכותית, עשוי להוות מחסום משפטי ללמידת מכונה יעילה ולצמיחה של שוק הבינה מלאכותית.

נושא זה מצוי בליבה של גל של תביעות אשר הוגשו בעיקר בארה"ב, כנגד חברות מובילות,

רבות מהן מבקשות הכרה כתובענות ייצוגיות, בגין שימוש בתכנים מוגנים, לרבות תמונות, קוד, יצירות ספרותיות ויצירות מוסיקליות), לצורך אימון מודלים של בינה מלאכותית. כך למשל, חברת Getty Images הגישה תביעה כנגד חברת STABILITY AI, INC.  בטענה כי סטביליטי עשתה שימוש בלמעלה מ-12 מיליון תמונות של גטי, לצורך אימון מערכת הבינה המלאכותית המוכרת  Stable Diffusion. החברה דרשה להפסיק לאמן את המודל באמצעות התמונות וכן פיצוי כספי.

 

בגל תביעות נוסף שהוגשו בתקופה האחרונה, הגישו מספר יוצרים מוערכים ומוכרים, תביעות כנגד חברות שונות בטענה לשימוש ביצירות ספרותיות בזכויות יוצרים לצרכי אימון מודלים של בינה מלאכותית, ללא הרשאה, לא קרדיט וללא פיצוי לבעלי זכויות היוצרים.

 

גם בתחום המוסיקה, הגישו מספר חברות פאבלישינג (מו"לות), ובכללן חברת Universal Publishing Group הגישה תביעה כנגד חברת הבינה המלאכותית Anthropic PBC, בטענה כי החברה עשתה שימוש במילות השירים לצרכי אימון מערכת הבינה המלאכותית שלה – "קלוד", וזאת ללא קבלת הרשאה מראש מבעלי הזכויות.

 

לפי פסיקה תקדימית שיצאה לאחרונה מבית המשפט הפדרלי בניו יורק, אימון של בינה מלאכותית על תוכן שנקצר מהרשת על ידי החברות שמפתחות מודלים, אינן מהוות הפרה של זכויות יוצרים, או זה לפחות המקרה בתביעה המדוברת. ההשלכות עשויות לערער את עולם הבינה המלאכותית ואת דיני זכויות היוצרים.

 

מדובר בפסיקה תקדימית שעשויה להביא לתוצאות מרחיקות לכת בכל הקשור ליכולת של חברות AI  להשתמש בתכנים אותן הם אוספות מהרשת כדי לאמן את המודלים שלהן. לצד זאת, ביהמ"ש קבע מסגרת לחוקיות השימוש בתוכן מסוג זה, והיא שהדבר חוקי כל עוד החברות מהן נלקח התוכן לא הוכיחו שנגרם להן נזק או שהופרו זכויות היוצרים שלהן.

בפסק דין זה דחה ביהמ"ש את תביעת Raw Story Media  ו –  AlterNet Media  על הפרת זכויות יוצרים כנגד חברת Open AI. החברות טענו שOpen AI השתמשה בכתבות המוגנות בזכויות יוצרם ללא הרשאה, במטרה לאמן את המודלים שלה.

התביעה שנדונה התמקדה בחוק ה- DMCA  נגד פיראטיות תוכנה והחברות התובעות, AlterNet ו- Raw Story ביקשו פיצוי של 2,500 דולר בגין כל הפרה.

באשר לחוק – Digital Millennium Copyright Act (DMCA) הוא חוק זכויות היוצרים של המילניום הדיגיטלי (DMCA) שנחקק בארה”ב בשנת 1998.

לטענת התובעות OpenAI ידעה שהשימוש בתוכן שלהן לטובת אימון המודל של החברה יביא להפרה של החוק בכל פעם שChatGPT  יחזיר תשובות המכילות תכנים ששימשו לאימון ללא קרדיט.

מנגד, לטענת OpenAI החברות לא הצליחו להוכיח ש -ChatGPT אומן על התוכן שלהן, או שהאימון הזה פגע בהן. ביהמ"ש מצא כי טענה התובעים אינה נתמכת כראוי, שכן התובעים לא הצליחו לזהות יצירות ספציפיות המוגנות בזכויות יוצרים שהופרו לכאורה.  יובהר כי החברות יכולות לערער על ולהגיש תביעה מתוקנת, בין היתר, בעילות אחרות על בסיס משפטי שונה מזה אשר עמד בבסיס התביעה האמורה.

הדגש של ביהמ"ש על ראיות פרטניות וקונקרטיות להפרה עלול להצביע על כך שמקרים עתידיים עשויים להתמקד בנזק בר הוכחה ולא ביכולות תיאורטיות.

https://storage.courtlistener.com/recap/gov.uscourts.nysd.616533/gov.uscourts.nysd.616533.117.0.pdf