সৌভিক মুখার্জী, কলকাতা: ভারতের কৃত্রিম বুদ্ধিমত্তা বা AI দুনিয়ায় এবার দ্রুত উত্থান ঘটাল বেঙ্গালুরু ভিত্তিক স্টার্টআপ Sarvam AI। সাম্প্রতিক সময়ে তাদের নতুন দুটি উদ্ভাবন Sarvam Vision এবং Bulbul V3 প্রযুক্তি মহলে বিরাট সাড়া ফেলেছে। দাবি করা হচ্ছে, বিশেষ করে অপটিক্যাল ক্যারেক্টার রিকগনেশন প্রযুক্তিতে এই মডেল নাকি Google এর Gamini এবং ChatGPT এর মতো বিশ্বমানের প্ল্যাটফর্মকেও হারিয়ে দিয়েছে। আদৌ কি তাই?
OCR পারফরমেন্সে বিরাট সাফল্য
Sarvam AI এর সহ প্রতিষ্ঠাতা প্রত্যুষ কুমার সম্প্রতি সোশ্যাল মিডিয়া হ্যান্ডেলে লিখেছেন, olmOCR-Bench-এ Sarvam Vision 84.3% অ্যাকিউরেসি পেয়েছে, যা নাকি Gemini 3 Pro ও DeepSeek OCR v2 এর থেকেও বেশি। সবথেকে বড় ব্যাপার, OmniDocBench v1.5-এ এই মডেলের নির্ভুলতা পৌঁছেছে 93.28%। আর ডকুমেন্ট রিডিং থেকে শুরু করে স্ক্যান বা টেবিল পার্সিং এর মতো জটিল কাজে মডেলটি বিশেষভাবে নজর কেড়েছে।
Drop 4/14: Introducing Sarvam Vision: a state-space based 3 billion parameter vision language model that is competitive with the best results in digitisation in English, and defines a significantly higher bar for Indian languages. See the details in our blog:…
— Pratyush Kumar (@pratykumar) February 5, 2026
ভারতীয় ভাষায় ভয়েস সাপোর্ট Bulbul V3
Sarvam AI এর সবথেকে বড় আকর্ষণ হচ্ছে Bulbul V3। এটি একটি উন্নত টেক্সট টু স্পিচ মডেল। এর মূল বৈশিষ্ট্যগুলি হল- 35টি আলাদা ভয়েস অপশন, 22টি তপশিলভুক্ত ভারতীয় ভাষা সাপোর্ট এবং বিভিন্ন মানের স্ক্যান ও কনটেন্ট থেকে ভয়েস জেনারেশনের সক্ষমতা। এমনকি এর ভিতরে থাকা ডেটা সেট 1800 সাল থেকে বর্তমান সময় পর্যন্ত ভাষার নমুনা দিতে পারে। আর ভারতীয় ভাষার উচ্চারণ, টোন বা লোকাল বৈচিত্র্য ধরতে এই মডেলটি বিশেষভাবে উপযোগী।
এদিকে Sarvam Vision-এ রয়েছে প্রায় 3 বিলিয়ন প্যারামিটারের একটি স্টেট স্পেস ভিশন ল্যাঙ্গুয়েজ মডেল। এটি ইমেজ ক্যাপশনিং, সিন টেক্সট রিকগনিশন, চার্ট ইন্টারপ্রিটেশন, কমপ্লেক্স টেবিল পার্সিং, ভিজ্যুয়াল ডকুমেন্ট আন্ডারস্ট্যান্ডিং এর মতো কাজ করতে সক্ষম। অর্থাৎ, শুধুমাত্র লেখাপড়া নয়, বরং ছবি ও ডেটা মিলিয়ে বিশ্লেষণ করতে পারবে এই কৃত্রিম বুদ্ধিমত্তা।
আরও পড়ুন: SIR-র চাপে নাজেহাল, স্কুলের মধ্যেই গলায় দড়ি দিয়ে আত্মহত্যার চেষ্টা বিএলও-র
স্বনির্ভর ভারতের মূল লক্ষ্য Sovereign AI
এদিকে Sarvam AI নিজেদের Sovereign AI হিসেবে তুলে ধরেছে। তাদের মূল লক্ষ্য হল ভারতের জন্য ভারতেই AI অবকাঠামো তৈরি করা, দেশীয় ভাষা এবং ডেটা নির্ভর প্রযুক্তি উন্নয়ন করা, এআই-কে সাধারণ মানুষের নাগালের ভিতরে নিয়ে আসা এবং স্থানীয় সমস্যা অনুযায়ী সমাধান বানানো। কোম্পানির মতে, AI-র মতো বড় প্রযুক্তিগত পরিবর্তনকে ভারত যেন আত্মবিশ্বাস আর নিয়ন্ত্রণের সঙ্গে গ্রহণ করতে পারে, সেই পরিকাঠামো গড়ে তোলায় তাদের উদ্দেশ্য।