داده‌های ویکی‌پدیا در اختیار توسعه‌دهندگان هوش مصنوعی؛ تلاشی برای مقابله با ربات‌های خزنده

داده‌های ویکی‌پدیا در اختیار توسعه‌دهندگان هوش مصنوعی؛ تلاشی برای مقابله با ربات‌های خزنده

هوش مصنوعیاینترنت و شبکهفناوری

پنج‌شنبه ۲۸ فروردین ۱۴۰۴ – ۱۵:۱۲مطالعه 1 دقیقه

امیر عبدالملکی

بنیاد ویکی‌مدیا مجموعه‌ای سفارشی و اختصاصی از داده‌های ویکی‌پدیا را برای مقابله با ربات‌های خزنده، در اختیار توسعه‌دهندگان قرار می‌دهد.
تبلیغات

بنیاد ویکی‌مدیا برای مقابله با ربات‌های خزنده از سوی توسعه‌دهندگان هوش مصنوعی، دیتاست‌های اختصاصی منتشر کرده که برای آموزش مدل‌های هوش مصنوعی بهینه‌سازی شده‌ است.

ویکی‌مدیا می‌گوید با همکاری Kaggle (پلتفرم متعلق به گوگل برای جامعه‌ی داده‌کاوی) نسخه‌ی آزمایشی مجموعه‌ای از محتوای ساختاریافته‌ی ویکی‌پدیا به زبان‌های انگلیسی و فرانسوی را منتشر کرده است.

به گفته‌ی بنیاد ویکی‌مدیا، دیتاست مذکور به‌گونه‌ای طراحی شده که با جریان‌های کاری یادگیری ماشین سازگار باشد و دسترسی توسعه‌دهندگان به محتوای قابل‌خواندن توسط ماشین را برای اهدافی مانند مدل‌سازی، ریزتنظیم، ارزیابی، هم‌راستاسازی و تحلیل آسان‌تر کند.

محتوای مورد بحث دارای مجوز آزاد است و شامل خلاصه‌های پژوهشی، توصیف‌های کوتاه، پیوند به تصاویر، داده‌ها و بخش‌های مختلف مقاله‌ها می‌شود؛ بااین‌حال، منابع و عناصر غیرنوشتاری مانند فایل‌های صوتی حذف شده‌اند.

مقاله‌های مرتبط
  • ویکی‌پدیا در مرز فروپاشی است؟
  • ۱۷ حقیقت جالب در خصوص ویکی‌پدیا

ویکی‌مدیا می‌گوید ارائه‌ی محتوا در قالب فایل‌های JSON ساختاریافته که جایگزینی مناسب و کم‌هزینه‌تر برای روش‌های مرسوم استخراج یا پردازش متن خام مقالات است؛ فرایندهایی که باعث فشار سنگین روی سرورهای ویکی‌پدیا شده‌اند چون ربات‌های خزنده‌ی هوش مصنوعی به‌طور مداوم درحال مصرف پهنای باند این پلتفرم هستند.

درحال‌حاضر ویکی‌مدیا با شرکت‌هایی مانند گوگل و Internet Archive قرارداد اشتراک‌گذاری داده دارد؛ اما همکاری با Kaggle می‌تواند این اطلاعات را برای شرکت‌های کوچک‌تر و دانشمندان مستقل دردسترس قرار دهد.

مقاله رو دوست داشتی؟
نظرت چیه؟
  • امیر عبدالملکی

داغ‌ترین مطالب روز
فتانه رعدی

Share
Published by
فتانه رعدی

Recent Posts

بیش از 50 افزونه‌ مخرب کروم درحال جاسوسی از شما هستند

اگر از مرورگر کروم استفاده می‌کنید و افزونه‌هایی نصب کرده‌اید که ظاهر بی‌خطری دارند، بهتر…

5 ساعت ago

هشدار دموکرات‌ها: DOGE به‌دنبال جمع‌آوری اطلاعات حساس آمریکایی‌ها است

براساس گزارشی تازه، دموکرات‌های مجلس نمایندگان آمریکا هشدار داده‌اند نهاد DOGE که ایلان ماسک آن…

7 ساعت ago

آغاز تجاری‌سازی نسل پنجم تلفن همراه (5G) در رایتل

آغاز تجاری‌سازی نسل پنجم تلفن همراه (5G) در رایتلفناوری ایراناینترنت و شبکهشنبه ۳۰ فروردین ۱۴۰۴…

10 ساعت ago

سریع‌ترین حافظه فلش جهان معرفی شد؛ ثبت اطلاعات در ۴۰۰ پیکوثانیه (۰٫۴ نانوثانیه)

سریع‌ترین حافظه فلش جهان معرفی شد؛ ثبت اطلاعات در ۴۰۰ پیکوثانیه (۰٫۴ نانوثانیه)مطالب حافظهسخت افزارشنبه…

11 ساعت ago

چین سریع‌ترین حافظه جهان را معرفی کرد؛ انجام ۲۵ میلیارد عملیات در ثانیه

تیمی از پژوهشگران دانشگاه فودان چین موفق به ساخت سریع‌ترین دستگاه ذخیره‌سازی نیمه‌هادی در جهان…

14 ساعت ago

پشت‌پرده هک انجمن ناشناس 4chan؛ عمر «لجن‌زار اینترنت» به سر رسید؟

پشت‌پرده هک انجمن ناشناس 4chan؛ عمر «لجن‌زار اینترنت» به سر رسید؟اینترنت و شبکهامنیت و حریم…

1 روز ago