প্রকল্প প্রস্তাবনা


  • প্রকল্পperiodicalDB হল একটি ক্রমবর্ধমান বৈদ্যুতিন বাংলা তথ্য সমুচ্চয় ও সংযোগ (data collection and connection)। এটিকে বাংলা পত্রপত্রিকার রচনাসূচী সংগ্রহ হিসেবেও বর্ণনা করা যায়। কিন্তু এই প্রকেল্পর লক্ষ্য আরো বৃহত্তর। বাংলা তথ্য সমূহকে সুসংগঠিত (structured data) করে তথ্যের প্রসঙ্গ ও অভিপ্রায় চিহ্নিত করা এই website-এর লক্ষ্য। এর ফলে বাংলা ভাষায় জ্ঞান অন্বেষণ ও উদ্ভাবনের (knowledge access and discovery) পথটি সুগম হবে।

    এই website-এ নিয়মিত তথ্য সংযোজন করা হচ্ছে।

    ১৮১৮ সাল থেকে শুরু করে বর্তমান বাংলা পত্রপত্রিকার textual corpus-কে বাংলা তথ্য সমুদ্র বললে অত্যুক্তি হয়না। এই website-টি সেই তথ্য সমুদ্রের দিক নির্ণয় করতে সাহায্য করবে। বাংলা প্রাথমিক সূত্র অন্বেষণ ও গবেষণায় সুবিধা হবে।

    এখানে পাওয়া যাবে পত্রপত্রিকার রচনা সূচী ও তাদের মধ্যে কালানুক্রমিক ও বিষয়ভিত্তিক সংযোগ। কাজ শুরু হয়েছে পুরনো বাংলা পত্রপত্রিকা দিয়ে (early Bengali periodicals)। এই মুহূর্তে বাংলা পত্রপত্রিকা নির্বাচনের ক্ষেত্রে গুরুত্ব দেওয়া হয়েছে বর্ণানুক্রম, কালানুক্রম ও বিষয়ের বিভিন্নতাকে। একসাথে অনেকগুলি পত্রিকার কাজ হচ্ছে। তাই কোন একটি দীর্ঘজীবী পত্রিকার সব সংখ্যা এখনই পাওয়া যাবে না। তবে ধীরে ধীরে সবই সংযুক্ত হবে। চোখ রাখতে হবে হালনাগাদ পাতায়।

    বাংলা পত্রপত্রিকা digital image রূপে সংরক্ষণের কাজ অনেকদিন আগেই শুরু হয়েছে। এই প্রচেষ্টাগুলির ফলে পুরনো বাংলা পত্রপত্রিকাগুলি কালের গর্ভে হারিয়ে যেতে যেতেও বৈদ্যুতিন মাধ্যমে সংরক্ষিত হয়ে রয়েছে। বিভিন্ন গ্রন্থাগার ও সংরক্ষণাগারগুলি এই বিষয়ে সচেষ্ট। বাংলা পত্রপত্রিকার image corpus-গুলি থেকে বাংলায় বৈদ্যুতিন পাঠ-তথ্য আহরণের কাজে সুবিধা করে দিচ্ছে Optical Character Recognition (OCR) প্রযুক্তি।

    বাংলা OCR প্রক্রিয়াটি বিস্তারিত এই প্রকল্প প্রস্তাবনায় আলোচনা করা হচ্ছে না কিন্তু বলা যায় যে বৈদ্যুতিন পাঠ-তথ্য নিয়ে কাজ করতে গেলে OCR হল একটি প্রাথমিক প্রয়োজন। OCR করা পাঠের তথ্যকে শ্রেণীবদ্ধ করে তাদের মধ্যে সম্পর্ক স্থাপন করে একটি অনুক্রম খুঁজে বার করলে তবেই তথ্য থেকে জ্ঞান উদ্ভাবনের পথে যাওয়া সম্ভব। কিন্তু এই কাজটি দীর্ঘ ও সময় সাপেক্ষ। তাই প্রকল্পperiodicalDB-তে কোন রচনার পূর্ণ পাঠ নেই, রয়েছে উদ্ধৃতাংশ। খুব ছোট রচনা হলে পুরো পাঠটি দেওয়া হয়েছে। তাই আপনাদের ফিরে যেতে হবে পত্রপত্রিকার পাতায়; পৃষ্ঠাঙ্ক দেওয়া আছে।

    খুব ছোট করে বলা যায়, এই প্রকল্প, তথ্য আহরণ, নির্বাচন ও বিষয়শ্রেণী গঠন করে পূর্বনির্ধারিত কাঠামোতে তথ্য নিবেশ ও algorithm-এর সাহায্যে বাংলা তথ্যকে সুসংগঠিত করার একটি প্রচেষ্টা। Website-টি ব্যবহার করার আগে অবশ্যই সহায়িকাটি পড়ে নেবেন।

    প্রকল্পperiodicalDB একটি স্বাধীন গবেষণামূলক প্রচেষ্টা। এই প্রচেষ্টা যদি আপনাদের গবেষণার কাজে, বাংলা তথ্য খুঁজতে সহায়ক হবে বলে মনে হয়, প্রকল্পperiodicalDB-তে subscribe করুন। Subscription মূল্য প্রকল্পটিকে সময়, শ্রম ও প্রযুক্তির সাহায্যে এগিয়ে নিয়ে যেতে সহায়তা করবে।

    প্রকল্পperiodicalDB blog পড়তে subscription বা login করতে হয়না। প্রকল্পperiodicalDB blog-এর চয়ন বিভাগে পুনঃপ্রকাশিত হচ্ছে বাংলা পত্রপত্রিকা থেকে সংগৃহিত কবিতা, প্রবন্ধ, উদ্ধৃতাংশ, বিজ্ঞাপন, ইত্যাদি। বিষয়/ ব্যক্তি/ ঘটনা, ইত্যাদির সূত্র ধরে রচনা চয়ন করা হচ্ছে। #digitaltextarchivebangla