بایدو ابزار تبدیل عکس به متن ابداع کرد
به گزارش خبرگزاری مهر به نقل از رویترز، این شرکت چینی که برترین موتورجستجوی چین نیز به حساب می آید از جمله برترین شرکت های فناوری است که حدود 2 سال پس از سرمایه گذاری کلان در تحقیق و توسعه مدل هایی که جایگزینی برای چت جی پی تی شرکت اوپن ای آی هستند اکنون تمرکز خود را به تجاری سازی مدل های بزرگ زبانی کاربردی معطوف کرده است.
رابین لی مدیر ارشد اجرایی بایدو در کنفرانس سالانه جهانی شرکت، محصول I-RAG را معرفی کرد که یک فناوری تبدیل متن به عکس است و قابلیت های جستجوی بایدو برای برطرف کردن مشکل «توهم زدن» را ارتقا می دهد. این مشکل زمانی به وجود می آید که عکس های تولیدی ربطی به متن وارد شده ندارند یا حاوی عناصر غیر واقعی هستند.
به گفته لی پلتفرم «ارنی» بایدو اکنون روزانه بیش از ۱.۵ میلیارد جستجوی کاربر دارد و همچنین واکنش های روزانه را کنترل می کند. این رقم نشان دهنده افزایش قابل توجهی نسبت به کنترل ۲۰۰ میلیون درخواست روزانه ای است که در ماه می گزارش شد.
کنش و واکنش ها شامل وظایفی مانند تولید متن، پاسخ دادن به سوالات و کمک در به کارگیری اپلیکیشن های مختلف با استفاده از هوش مصنوعی است.
تلاش های تجاری سازی بایدو به طور کلی حول محور هوش مصنوعی آن است که به کاربران اجازه می دهد اپلیکیشن های خاص خود را تولید کنند. این شرکت همچنین فناوری را در سری محصولات فعلی خود یکپارچه کرده و آن را با استفاده از سرویس های ابر به کاربران خارج از سیستم نیز ارائه می کند.
همچنین بایدو یک عینک با قابلیت دستیار هوش مصنوعی توسعه داده که توسط بخش سخت افزار آن(Xiaodu) ابداع شده است. این گجت مجهز به دوربین هایی است تا عکس و ویدئو را ثبت و از کنش و واکنش های صوتی با «ارنی» پشتیبانی کند.
به گفته لی، بایدو قصد ندارد یک ابر اپلیکیشن مبتنی بر هوش مصنوعی بسازد این امر نشان دهنده انحرافی از استراتژی شرکت های دیگر مانند بایت دنس است که چند اپلیکیشن هوش مصنوعی جداگانه می سازند.