اکثربے تکلف احباب دل دکھانے کو گاہے بگاہے یہ سوال کیا کرتے ہیں کہ بھئی تمہارا پی.ایچ.ڈی کب مکمل ہو رہا ہے یا تمہاری تحقیق کا کیا حال ہےیا تمہارا مقالہ تو ختم ہو کر ہی نہیں دے رہا وغیرہ وغیرہ. اس ضمن میں جامعہ اسٹینفورڈ کے فارغ التحصیل، پی ایچ ڈی کامکس کے خالق ہورہے چام کا کہنا ہے کہ گریجویٹ اسکول کا پہلا اصول یہ ہے کہ گریجویٹ اسکول کے طالبعلم سے ازراہ ہمدردی مندرجہ بالا سوالات نا کئے جائیں، شکریہ۔
یہ تو خیر جملہ معترضہ ٹھرا۔ یہاں کوشش یہ ہے کہ عام فہم انداز میں یہ بتانے کی کوشش کی جاۓ کہ راقم کے مقالے کا موضوع کیا ہے. مجھے علم ہے کہ اس کوشش میں نا تو میں عام فہمی سے انصاف کر پاوں گا اور نا تکنیکیت سے، اور دونوں طرف سے بری بھلی سننے کو ملیں گی، لیکن کیا خوب کہا مرزا نوشہ نے کہ اپنے جی میں ہم نے ٹھانی اور ہے۔
اس سے قبل تھوڑا سا پی.ایچ.ڈی کی پوسٹ گریجویٹ اکیڈمک ڈگری کا تعارف ہو جاۓ. “پی.ایچ.ڈی” یا “ڈاکٹر آف فلاسفی” ایک اکیڈمک یا تعلیمی ڈگری ہے جو درحقیقت کسی موضوع پر کی جانے والی اس اصل تحقیق کے نتیجے میں ملنے والی تحقیقی منزلت یا اجازہ کا نام ہے ۔ اس ڈگری کا منتہا ایک مقالہ و ‘ڈاکٹر؛ کا سابقہ ہوا کرتا ہے لیکن اصل محصول تحقیق کی عادت ۔ ڈاکٹر عنیقہ ناز مرحومہ نے اسی موضوع پر راقم کی ایک تحریر پر تبصرہ کرتے ہوئے کہا تھا کہ
پی ایچ ڈی اسپیشلائزین نہیں…، بہت سے لوگ اسی غلط فہمی میں ہیں۔ یہ دراص ایک طرح کی تربیت ہے دماغ کو آزاد روی سے سوچنے کی طرف لے جانے کی۔ اس لئے اسکی تحقیق کے عنوان سے لیکر نتائج کو جمع کرنا اور پھر انکا دفاع کرنا پی ایچ ڈی کرنے والے کی ذمہ داری ہوتا ہے۔ جبکہ ماسٹرز کی ڈگری تک یہ ٹریننگ نہیں ہوتی۔
پی ایچ ڈی کا مطلب ویژن یا بصیرت پیدا کرنا ہوتا ہے۔ اپنے راستے خود متعین کرنا،امشاہدات سے اپنے ذاتی نتائج نکالنے کی اہلیت رکھنا، اس وقت جب تمام لوگ سمجھتے ہیں کہ رات نجانے کتنی لمبی ہے اس چیز کی اہلیت رکھنا کہ صبح کے آنے کے آثار ہیں یا نہیں
عمومی طور پر پی ایچ ڈی کے دو حصّے ہوا کرتے ہیں ایک “کورس ورک ” کہلاتا ہے جس میں محقق، تحقیقی کورسز کو مکمل کرتے ہیں۔ اس کو اکثر ممالک میں ایم فل یا ماسٹر آف فلاسفی کے نام سے بھی جانا جاتا ہے۔ دوسرا حصّہ مقالے کا ہوتا ہے.ہماری جامعہ کے ڈین ڈاکٹر ایکرمین نے اورینٹیشن کے دوران طلبا کو ڈرانے کے لئے خصوصی طور پر بتایا کہ شماریاتی طور پر پچاس فیصد طلبا جو پی.ایچ.ڈی کے پروگرام میں داخلہ لیتے ہیں. اے.بی.ڈی ہو کر پروگرام کو چھوڑ دیتے ہیں. اے.بی.ڈی کا مطلب ہوتا ہے “آل بٹ ڈسرٹیشن” یعنی اگر آپکا کورس ورک مکمل ہو جاۓ لیکن مقالہ مکمل نہ ہو تو آپکو اے.بی.ڈی یا ریسرچ ڈاکٹریٹ کہا جاتا ہے.امریکا میں “پی.ایچ.ڈی” کا عمومی وقت پانچ سے سات سال کا ہوتا ہے اسی طرح سے دوسرے یورپی ممالک مثلآ برطانیہ میں پی ایچ ڈی کچھ کم عرصے کے دوران مکمل کیا جا سکتا ہے ۔
راقم کی تحقیق کمپیوٹر سائنس کی ذیلی شاخ آرٹیفیشل انٹیلیجنس یا مصنوعی ذہانت کی دو ذیلی شاخوں مشین لرننگ اور ڈیٹا مائننگ سے تعلق رکھتی ہے۔ راقم اپنی تحقیق کو ایک جملے میں آسانی کے لئے،عام فہم غیر تکنیکی الفاظ میں بیان کرے تو کچھ اسطرح کہا جا سکتا ہے کہ
ڈیٹا کے کسی مجموعہ میں عمومی طور پر نہ پائی جانے والی اشیاء کی احتمالی دلچسپی کا شماریاتی پیمانہ
یہ تحقیق دراصل تین مختلف مطالعوں کے علاقہ جات کا مجموعہ ہے.
اولا – احتمالی گرافیکل نمونہ جات
ثانیا – امکانیاتی پیمانہ ہاۓ شماریاتی دلچسپی
اور ثالثا – دور افتادہ عوامل کی تلاش اور توجیح
ان تین مطالعوں کےعلاقوں کے تحقیقی ادغام و اشتراک سے راقم کی کوشش ہے کہ ایک ایسا الگورتھم یا طریقہ کار معرض وجود میں آسکے جو شماریاتی اصولوں کی بناء پر پیمانہ ہاے دلچسپی کو ڈھونڈھنے میں ہماری مدد کرتا ہو ۔
پی.ایچ.ڈی کے مقالہ کا بنیادی مقصد علمی معرفت کی ہئیت میں تبدیلی لانا ہوتا ہے. کسی بھی علمی میدان میں، معرفت علم میں تغیر و تبدل ہی پی.ایچ.ڈی کی تحقیق کا اصل مقصد ہوتا ہے۔ اگر ڈاکٹریٹ کی تحقیق کے دوران کسی مسئلے کا حل تلاش کیا جا رہا ہے تو اس بات کا قوئ امکان ہے کہ یہ مسئلہ اس سے پہلے کسی ریسرچر، کسی محقق، یا کسی عالم کے زیر مطالعہ رہا ہوگا. یا اس نے اپنے مقالہ میں یا تحقیقی کام میں اس کا ذکر ایک مسئلے کے طور پر یا مستقبل میں کئے جانے والے کام کے طور پر کیا ہوگا.
تحقیقی ادب کے مطالعے سے ہمیں جا بجا یہ پتا چلتا ہے کہ اے پرائوری یا استدلالی قوانین کی زیادتی ڈیٹا مائننگ کی دنیا میں ایک بڑا مسئلہ ہے. ایک آسان مثال سمجھنے کے لیے یہ دی جا سکتی ہے کہ اگر آپ کسی مارکیٹ کے خرید و فروخت کے مجموعے کو دیکھیں تو اس میں ڈبل روٹی، انڈے اور دودھ کی ایک ساتھ فروخت زیادہ نظر آئیگی. ان استدلالی قوانین کی حمایت اور اعتماد بھی اس مجموعے میں زیادہ ہوگا. اس حمایت اور اعتماد کو شماریاتی احتمالی دلچسپی کے پیمانوں میں سے ایک قرار دیا جا سکتا ہے اسی طرح سے شماریاتی امکانی دلچسپی کے پیمانے لٹریچر یا تحقیقی ادب میں اور بھی بہت سے پاۓ جاتے ہیں. مثلآ اٹھاؤ یا لفٹ، پئرسن کورلیشن، آڈ ریشو، لیپلاس تصیح وغیرہ
ان پیمانوں کا مجموعی اطلاق کر کے ہم اس بات کا بخوبی اندازہ لگا سکتے ہیں کہ اشیاء کا باہمی تعلق کتنا گہرا ہے.مثلآ ان استدلالی اصولوں کی بناء پر یہ مفروضہ بڑی آسانی سے قائم کیا جا سکتا ہے کہ اگر کسی شخص نے بانگ درا اور ضرب کلیم خریدی ہو تو اسے بال جبرئیل بھی یقینآ پسند آئیگی اس تعلق کو بہترین طریقے سے بیان کرنے کا کام گراف کی مدد سے بناۓ گئے احتمالی نمونوں سے کیا جا سکتا ہے. مثلآ اگر اسی بات کو شماریاتی احتمالی طور پر بیان کرنا ہو کہ بارش یا فواروں کا گھاس کے گیلا ہونے پر کیا اثر ہوتا ہے تو اسے اس مندرجہ ذیل سادہ گراف کی مدد سے با آسانی بیان کیا جا سکتا ہے.
اس احتمالی نمونے کو بائزین یقین کا اتصالی نمونہ یا بائزین بیلیف نیٹورک کہا جاتا ہے. عام استدلالی نمونہ جات کی بہ نسبت بائزین بلیف نیٹ ورک میں سلف اور خلف دونوں طرح کے استدلال کرنے کی سہولت حاصل ہوتی ہے. مثلآ مندرجہ بالا مثال سے ہم دیکھہ سکتے ہیں کہ گھاس کے گیلا ہونے سے بارش کے وقوع اور اس کا ماخوذ دونوں کس قدر آسانی کے ساتھہ معلوم کیے جا سکتے ہیں.
بائزین بلیف نیٹ ورک احتمالی گراف نمونوں کی ایک قسم ہے اسکی مدد سے آپ کسی ماہر فن کی راۓ کو ایک گراف کے نمونے میں محفوظ کر سکتے ہیں. تمام امکانات کو “سی.پی.ٹی” یعنی مشروط امکانات کے جدول میں بھی محفوظ کیا جا سکتا ہے. سب سے اہم بات یہ ہے کہ اس اتصالی نمونے میں چونکہ مختلف گروہوں کے باہمی تعلقات کو امکانات کی مد میں ظاہر کیا جاتا ہے اس لیے اس پر اشیاء کی دلچسپی کے احتمالی پیمانہ جات یا انٹرسٹنگنس میشرز کا آسانی سے اطلاق ہو سکتا ہے جیسا کہ قطری جامعہ کے رانا ملہاس اور ظاہر الغبری کے کام سے دیکھا جا سکتا ہے.
اس مختصر اور کسی قدر تکنیکی تمہید کے بعد اب آپ کو یہ سمجھنے میں آسانی ہوگی کہ راقم کی تحقیق اس موضوع پر ہے کہ کس طرح سے کسی ڈیٹا سیٹ میں کم تعداد میں پاۓ جانے والی اشیاء کی دلچسپی اور افادیت کی درجہ بندی بائزئن اتصالی نمونے کے ذریعے کی جاۓ نیز وہ کونسے ایسے شماریاتی، امکاناتی پیمانے ہیں جو کم پاۓ جانے والے عناصر کی موجودگی کے لئے زیادہ حساسیت رکھتے ہیں. راقم کا الگارتھم اور طریقہ کار، ٹریننگ ڈیٹا پر بائزین بلیف نیٹ ورک کو استعمال کرتے ہوئے حالات کے پس منظر کی نمائندگی کرنا اور اسکے بعد اس پر شماریاتی دلچسپی کے امکانات کا حساب نکالنا ہے. بعدازاں ٹیسٹ ڈیٹا سیٹ پر بھی انہی شماریاتی امکانات کا دوبارہ حساب لگایا جاے گا اور ان دونوں شماریاتی امکانات کی تفریق اس بات کو وضاحت دیگی کہ دونوں عناصر میں کس قدر فرق موجود ہے.، جس کی بنیاد پر اسکی افادیت کی درجہ بندی کی جاسکتی ہے۔
اب میری تحقیق اس مرحلے میں داخل ہو چکی ہے جس میں میں ایسے شماریاتی احتمالی امکانات کے پیمانوں پر خاص توجہ دے رہا ہوں جو صرف اس وقت زیادہ تبدیل ہوتے ہیں جب کوئی نایاب دلچسپی کا عنصر ڈیٹا سیٹ میں نظر آتا ہے مثلآ اگر آپ کی ساری خریداری کراچی میں ہو اور دن بھر کا خرچا عموما پانچ سو سے کم رہتا ہو اور اب اچانک آپ کے اکاؤنٹ میں لاہور کی ایک ٹرانزیکشن آجاۓ جو دس ہزار روپے کی ہو توفراڈ کے ماہرین کے لئے یہ نہایت غیر معمولی اور نادر دلچسپی کی چیز ہے لیکن اس کا تناسب پورے ڈیٹا سیٹ یا اسٹریم میں بہت کم ہوتا ہے.یہ ایک آسان مثال ہے جو یوکلیڈین فاصلے سے بھی نکالی جا سکتی ہے لیکن اگر ڈیٹا ہمہ جہتی ہو تو فاصلے اور گروہ بندی کے طریقہ کار اتنے کار آمد نہیں رہتے۔ فاصلہ ماپنے کے طریقہ کار کی بنسبت اس تحقیقی طریقے کار کا ایک اور بڑا فائدہ یہ ہے کہ اس انکشاف کو اتصالی ماڈل کے ذریعے نہایت آسانی کے ساتھہ واضح طریقے سے بیان کیا جا سکتا ہے.نیز کسی ماہر کے ذریعے اس نمونے کو تبدیل کرنا بھی نسبتاآسان کام ہے.
اس وقت میرے تحقیقی سوالات کا دائرہ کار انہی امور کے تجربات کے گرد گھوم رہا ہے کہ کونسے ایسے امکاناتی دلچسپی کے پیمانہ جات ہیں جن کی درجہ بندی سے استثنائی اشیاء کو بہترین طریقے سے جانا جا سکتا ہے. ان تجربات میں انسامبل طریقہ کار کو بھی مد نظر رکھا جا رہا ہے جس کے مطابق کسی ایک امکاناتی دلچسپی کے پیمانے کے بجاۓ عصر کلّی کو دیکھا جاۓ اور مختلف پیمانہ جات کو ان کی بنا پر ضم کردیا جاۓ.کورس ورک ختم کرنے اور تحقیقی کام میں اس مقام تک پہنچنے میں مجھے تقریبآ چارسال کا عرصہ لگا ہے اور امید ہے کہ ایک سے ڈیڑھ سال کے دوران ان تحقیقی سوالات کے جوابات دینے کے قابل ہو جاؤنگا اور اپنا مقالہ مکمل کر لوں گا، انشا اللہ.۔
امید ہے کہ آپکو یہ مضمون پسند آیا ہوگا اور احقر کے تحقیقی کام سے گو نہ گو آشنائی حاصل ہو گئی ہوگی۔
نوٹ – یہ مضمون ہماری والدہ محترمہ کی ۵۹ ویں سالگرہ کے موقع پر ان کو اور والد صاحب کو اپنے تحقیقی کام کے بارے میں معلومات فراہم کرنے کے لئے لکھا گیا تھا جس کو بعد ازاں عمومی مصرف کے لئے یہاں پیش کیا گیا۔