تستضيف Google نسخة من مؤتمر Cloud Next في طوكيو هذا الأسبوع، وتركز بشكل مباشر على تعديل قواعد بياناتها لأعباء عمل الذكاء الاصطناعي (لأنه في هذه المرحلة من عام 2024، الذكاء الاصطناعي هو الشيء الوحيد الذي تريد شركات التكنولوجيا الكبرى التحدث عنه). . يتضمن ذلك تحديثات لقاعدة بيانات Spanner SQL الخاصة بها، والتي تتميز الآن بدعم البحث في الرسوم البيانية والمتجهات، بالإضافة إلى إمكانات البحث عن النص الكامل الموسعة.
لن يكون هذا إعلانًا من Google بدون بعض الميزات التي تدعمها Gemini. وتشمل هذه الخدمات Gemini in BigQuery وLooker لمساعدة المستخدمين في هندسة البيانات وتحليلها، بالإضافة إلى مهام الحوكمة والأمن.
تقول جوجل إنه في حين أن الغالبية العظمى من المؤسسات تعتقد أن الذكاء الاصطناعي التوليدي سيكون حاسما لنجاح أعمالها، فإنها تعلم أيضا أن الكثير من بياناتها لا تزال غير مدارة، مما يجعلها خارج نطاق تحليلاتها ومبادرات الذكاء الاصطناعي الخاصة بها.
“عليهم أن يخرجوا حقًا من جميع صوامع البيانات وجزر البيانات الموجودة لديهم، وأن يصلوا إلى منصة بيانات موحدة متعددة الوسائط، تشمل البيانات المنظمة وغير المنظمة – [because] وأوضح جيريت كازماير، نائب الرئيس والمدير العام لقاعدة البيانات وتحليلات البيانات وLooker، أن GenAI رائع في تحليل البيانات غير المنظمة – والجمع بين البيانات غير النشطة وحركة البيانات الخاصة بها، وبالتالي تتم معالجة البيانات في الوقت الفعلي والبيانات غير النشطة. وقال إن تنشيط تدفق بيانات المؤسسة هو ما تدور حوله الكثير من هذه الميزات الجديدة.
يحصل Spanner على إمكانيات الرسم البياني والمتجه
تعمل شركة Spanner على تشغيل معظم منتجات Google الخاصة مثل Search وGmail وYouTube، وتشمل قائمة عملائها أمثال Home Depot وUber وWalmart وغيرها. وبينما يمكن لـ Spanner التعامل مع حجم هائل من البيانات، تعد قواعد بيانات المتجهات والرسوم البيانية ضرورية لجلب بيانات المؤسسة إلى تطبيقات GenAI وإثراء النماذج الأساسية الحالية.
قال آندي جوتمانز، نائب الرئيس والمدير العام لشركة Google: “ما نفكر فيه هو ما الذي يتطلبه الأمر حقًا بالنسبة لنا لأخذ مدى توفر Spanner وحجمه ونموذجه الارتباطي وتوسيع ذلك ليكون أفضل نظام أساسي للبيانات لتطبيقات GenAI التشغيلية”. قواعد بيانات. مثل العديد من موردي قواعد البيانات، فإن الخطوة الأولى هنا بالنسبة لشركة Google هي إضافة إمكانات الرسم البياني إلى Spanner، باستخدام معيار GraphQL الناشئ. يمكن للمؤسسات بعد ذلك استخدام هذا الرسم البياني لتعزيز تطبيقات GenAI الخاصة بها – والنماذج الأساسية التي تشغلها – باستخدام الجيل المعزز للاسترجاع (RAG)، والذي يعد حاليًا المعيار الفعلي لحالة الاستخدام هذه.
الجديد أيضًا في Spanner هو البحث عن النص الكامل والبحث المتجه، مع إمكانات البحث المتجه المدعومة بخوارزمية ScaNN من Google. “باستخدام Spanner Graph والبحث عن النص الكامل والبحث المتجه، قمنا بتطوير Spanner من … كونها قاعدة البيانات الأكثر توفرًا واتساقًا عالميًا وقابلة للتطوير، إلى قاعدة بيانات متعددة النماذج ذات إمكانات ذكية تتفاعل بسلاسة لتمكينك من تقديم فئة جديدة تقول Google: “من التطبيقات التي تدعم الذكاء الاصطناعي”.
بالإضافة إلى هذه التحديثات المرتكزة على الذكاء الاصطناعي، تحصل Spanner على هيكل تسعير اختياري جديد. الفكرة هنا، التي يطلق عليها اسم “إصدارات Spanner”، هي تقديم نموذج تسعير قائم على الطبقة يوفر لهم المزيد من المرونة. في الوقت الحالي، يتعين على عملاء Google Cloud الاختيار بين عرض منطقة واحدة وإصدار متعدد المناطق، والذي يقدم أيضًا مجموعة من الميزات الإضافية مثل النسخ المتماثل.
Bigtable يذهب إلى SQL
أعلنت Google أيضًا يوم الخميس عن تحديث كبير لقاعدة بيانات Bigtable، وهي قاعدة بيانات Google NoSQL للبيانات غير المنظمة وأحمال العمل الحساسة لزمن الوصول. يتميز Bigtable الآن بدعم SQL (أو بشكل أكثر دقة، دعم GoogleSQL، لغة SQL الخاصة بالشركة)، مما يسهل بشكل كبير على أي مطور تقريبًا استخدام الخدمة.
في السابق، كان على المطورين استخدام Bigtable API للاستعلام عن قواعد البيانات الخاصة بهم. حاليًا، يدعم Bigtable ما يقرب من 100 وظيفة SQL.
أوراكل على جوجل كلاود
بالنسبة لعشاق قاعدة بيانات Oracle، ستسمح لهم Google الآن باستضافة خدمات قواعد بيانات Oracle Exadata وAutonomous مباشرة في مراكز بيانات Google Cloud – ويمكنهم ربط تطبيقاتهم بين Google Cloud وOracle Cloud. بالنسبة لجوجل، هذا يعني المزيد من أعباء العمل في السحابة الخاصة بها، وبالنسبة لشركة أوراكل، على الأقل، يعني أن هؤلاء المستخدمين ما زالوا يدفعون رسوم الترخيص الخاصة بهم، حتى لو كانوا لا يستخدمون سحابة أوراكل.
الجديد أيضًا في Google Cloud هو دعم Apache Spark وKafka مفتوح المصدر لتدفق البيانات ومعالجتها، بالإضافة إلى البث في الوقت الفعلي من Analytics Hub (خدمة Google لمشاركة البيانات بشكل آمن بين المؤسسات).