إصدارات النادي

 

تحليل كلف البحث في قاعدة بيانات المستخلصات الكيماوية المتوافرة على الإنترنيت
د.عامر حقي القرغولي

مستخلص

تتضمن الدراسة تحليلاً لعناصر التكلفة المترتبة عن استخدام قاعدة معلومات المستخلصات الكيماوية من خلال ثلاث قنوات متوافرة في الشبكة المضيف (STN)• وقد شملت الكلفة (الوقت المستغرق في الاتصال بالخدمة، وعدد القيود المطبوعة• وعدد الكلمات المفتاحية المستخدمة في البحث الواحد)• والهدف هو:
1• إبراز سمات كل خدمة من الخدمات الثلاث بهدف إيجاد الطريقة الأقل تكلفة للحصول على نتائج نوعية•
2• المقارنة بين الخدمات لاختيار أفضل طرق البحث للحصول على المعلومات الكيماوية بكلفة قليلة وسرعة وكفاءة عالية•
الكلمات المفتاحية: CA Plus، التكلفة، قاعدة البيانات، الإنترنيت•
مقدمة
من السهولة القول إن استرجاع المعلومات آلياً On- Line يعني دائماً السرعة وقلة التكاليف، والنتائج المثالية، إلا أن التطبيق صعب جداً، فالبحث المبني على رؤية سريعة يمكن أن يؤدي إلى استرجاع رديء، بينما يؤدي البحث المدروس جيداً والمنجز بشكل صحيح إلى بذل مال أكثر ووقت أطول، كما أن هدف كل باحث هو جعل عملية الاسترجاع أقرب ما تكون إلى الكمال، وقد كانت المشكلة أقل تعقيداً مع قواعد البيانات الآلية التقليدية، لأن اختيار واحة المستفيد أو المصدر غير ضرورية، إلا أن توافر الشبكة (Web) وتأثيرها في هذه الأيام ساعد المنتجين على تقديم عدد كبير من القنوات التي تمتاز بأن لكل واحد منها هيكلية تسعير مختلفة، لذا فإن قاعدة بيانات المستخلصات الكيماوية مع القنوات المتوافرة خلال شبكة (SIN) الخاصة بتسهيل الدخول إلى المعلومات التي توفرها على يد متخصصي المعلومات والمستفيدين النهائيين لمعرفة بعض التفاصيل المتعلقة بالكلفة خاصة وبالسمات عامة تستحق النظر والدراسة، ولقد تم اختيار قاعدة بيانات المستخلصات الكيماوية CA plus وليس قاعدة CA في هذه الدراسة لسببين:
- CA Plus أكثر حداثة من CA•
- الوصول إلى قاعدة البيانات CA من خلال المضايف (Dialog, Data Star, Esa- Irs) لم يتم تغطيته بسبب عدم تكامل قيودها وغياب المستخلصات•
الخدمة والشبكة والمواقع
CAS هي خدمة المستخلصات الكيماوية، والمورد الأكثر شمولية في تغطية المعلومات الكيماوية التي تغطي براءات الاختراع إضافة إلى الأدبيات المنشورة في الدوريات إذ تنشر CAS عادة المستخلصات الكيماوية والمطبوعات ذات العلاقة وخدمة الأقراص المكتنزة، كما تشغل نظام التسجيلات الكيماوية لأكثر من 61 مليون قيد أساسي، وتنتج أيضاً مجموعة من قواعد بيانات آلية مباشرة متوافرة خلال الشبكة العالمية••• STN, STN Easy•
أما "STN" فهي شبكة عالمية للمعلومات العلمية والتكنولوجية الأولية لأنها توفر الدخول إلى أكثر من 002 قاعدة بيانات تابعة إلى منظمات علمية عالمية، وإنتاجها تم بمساعدة خدمة مستخلصات الكيمياء CAS وشركة FIZ Karlsruhe والشركة اليابانية للعلوم والتكنولوجيا، وقد صممت بسمات جعلت عملية البحث مريحة ودقيقة في قواعد بيانات الأدبيات العلمية وبراءات الاختراع وغيرها من المعلومات• ويمكننا الوصول إلى قاعدة بيانات CA Plus من خلال المضيف STN بثلاث طرق:
الأولى: لغة أوامر الرسول Messenger Command Language والموقع هو:
http:// www. cas. org/ stn. htm•
الثانية: واجهة الشبكة STN Easy ومواقعها:
htt:// stneasy. cas. org•
http:// stneasy. fiz. karlsruche. de•
httn:// www. japan. cas. org•
الثالثة: من خلال خدمة Scifinder من المنتج CAS•
http:// www. cas. org/ scifinder/ scicover2. htm1•
ولتحديد هيكلية التسعير لكل خدمة من الخدمات الموضحة أعلاه، والأكثر فاعلية للتكلفة عند الاستخدام، وتحت أي ظرف، جعلت التعريف بمزايا كل قناة (خدمة) ضروري وسيتضح كما مبين أدناه:
بحوث لغة الأوامر
المزايا الرئيسة:
1• صممت بشكل رئيس لمتخصصي المعلومات والمألوفة لديهم لغة أوامر المضيف messenger•
2• ضرورة إبرام اتفاقية خاصة مع المضيف STN•
3• يعد توافر برمجيات واجهة المستفيد (Front End) الخاصة مثل (STN Express )، مفيداً جداً•
4• تمكن لغة الأوامر من إيجاد الحلول للاستفسارات البسيطة والمعقدة جداً•
5• تشتمل سمة المستفيد على عدد كبير من الكلمات المفتاحية•
6• يمكن استرجاع الكلمات المفتاحية بشكل منفصل خطوة خطوة، والمجاميع الناتجة يمكن جمعها بحرية إلى تعابير منطقية معقدة جداً، كما يمكن استخدام المعاملات البوليانية الكلاسيكية مع معملات التقارب (التجاوز، الفقرات، الجمل، أدوات الربط)، للحصول على نتائج مرضية•
7. عمليات توسيع وتضييق البحث والنتائج المتعددة ممكنة عند تقديم كلمات مفتاحية إضافية كشروط لعمليات البحث•
8. يمكن البحث في قواعد بيانات ببليوغرافية أخرى إضافة إلى قاعدة بيانات CA Plus في آن واحد، كما يمكن إبعاد المكررات من نتائج البحث أيضاً•
9. إمكانية تحليل نتائج البحث بإضافة أدوات مناسبة إضافية، إضافة إلى الفوائد المختلفة المتوافرة بوساطة لغة الأمر•
01.كلفة قاعدة بيانات CA Plus نفس كلفة CA إضافة إلى 5% عن الجلسة الكاملة•
كلف البحث
يقدم المضيف STN ثلاث نسخ من بحوث قاعدة بيانات CA Plus، تختلف فقط في معدلات كلفة البحث الواحد••
1• قاعدة بيانات CA Plus القياسية•
الكلفة المترتبة عن وقت الاتصال 0.50 دولار لكل دقيقة ،وسعر الوحدة لعرض قيد كامل وطبعه هو 11•2 دولار، وكلفة كل مصطلح يتم البحث فيه هو 33•1دولار، وتكلفة بحث CAS هذه لا يشترك بها منتجو قواعد البيانات، أما الكلفة الأصلية لكل عملية استرجاع فتحسب كالآتي:
الكلفة = (05•0 * أ) + (11•2 * ب) + (33•1 * ج) دولار •
حيث:
أ= الوثائق المتعلقة بوقت الاتصال•
ب= عدد القيود المطبوعة•
ج= عدد الكلمات المفتاحية المستخدمة في البحث•
2 • ZCA Plus
لا تحسب كلفة الاتصال (أي كلفة البحث لاتعتمد الوقت المستغرق في إجرائه) لأن سعر الوحدة للقيد الكامل هو 11•2 دولار (الكلفة تعتمد عدد القيود المطبوعة) وسعرالمصطلحات المستخدمة في البحث هو 37•1 دولار لذا فالكلفة الإجمالية هي:
الكلفة = (00•0 * أ) + (11•2 * ب) + (37•1 * ج) دولار•
3 • HCA plus
سعر كلفة الاتصال بالدقيقة هو 58•2 دولار (كلفة البحث تعتمد الوقت المستغرق في إجراء البحث)، وسعر الوحدة لقيد كامل هو 11•2 دولار (كلفة العدد الكلي للقيود المطبوعة)، ولا تترتب كلف عن عدد المصطلحات المستخدمة•
الكلفة = (58•2 * أ) + (11•2 *ب) + (00•0 * ج)دولار•
توفر نسخ البحث الآلي المباشر التقليدي الثلاث أعلاه تشكيلة فحص SCAN لمخرجات القيود مجاناً، وتستخدم هذه التشكيلة فقط لفحص أخطاء البحث بعرض العناوين ومصطلحات الكشاف عشوائياً، ولا تعرض وفق أرقام القيود، ولذلك لا تستخدم في عملية اختيار مصادر محددة لأغراض الطبع، وفي حالة طلب مخرجات بالعناوين بالترتيب فإن الكلفة المترتبة عن ذلك هي 42•0 دولار عن كل عنوان•
قاعدة بيانات CA plus إلى الشبكة STN Easy
تتميز بما يلي:
1• لا تتطلب استخدام برمجيات إضافية، وأسلوب التصفح التقليدي للشبكة هو المستخدم•
2• مصمم لخدمة المستفيد النهائي•
3• لا توجد حاجة لإبرام اتفاقية خاصة مع STN، ما دامت الاتفاقية التي تغطي خدمة البحث الآلي المباشر التقليدية مع لغة الاستفسار مطبقة، والعكس بالعكس•
4• استجابة أبطأ عن طريق الإنترنيت لأن وقت الاستجابة يعتمد على اتصالات الشبكة العنكبوتية العالمية والإنترنيت التي تكون في بعض الأحيان كعنق الزجاجة•
5• يسمح بإستراتيجيات البحث البسيطة مثل (أ معامل 1، ب معامل 2،ج معامل 3، د•••) ومع هذا التعبير يمكن استخدام المعاملات AND ضمن القيد الواحد، أو NEAR ضمن الجملة وكذلك OR أو NOT وما عدا NEAR لا توجد معاملات مجاورة أخرى• وأ، ب، ج يمكن أن تكون كلمات مفتاحية أو عبارات وتغلق بالاقتباسات، أما المعامل الثالث وغيره من المعاملات فهو إما AND أو NOT وتتمثل عمليات تضييق البحث الأخرى بنوع الوثيقة أو اللغة أو سنة النشر•
6• (أ OR ب) AND (ج OR د) لايمكن أن ينجز في عملية بحث واحدة، بل يتم بمعالجتين منفصلتين (أ OR ب، AND ج) و(أ OR ب،AND د)> والتكرارت المحتملة في هذه الحالة لا تحذف (أوتوماتيكياً) ولذلك يتم فحص العناوين الناتجة عن نتائج البحث الثاني، لتجنب هذه التكرارات•
7• القابلية في البحث في أكثر من قاعدة بيانات واحدة تتشابه في التغطية في آن واحد، والنسخة الأخيرة من STN Easy تعرض بعض المكررات إن ظهرت ضمن القواعد المختلفة•
8• إضافة إلى قاعدة بيانات CA Plus فإن STN Easy توفر الدخول إلى أغلب القواعد التي يمكن الوصول إليها خلال المضيف STN، إلا أنها لا تسمح بالبحث في الهياكل الكيمياوية أو الهياكل الفرعية•
كلف البحث
لا تفرض كلفة على وقت الاتصال، وسعر الوحدة 58•3 دولار للقيد الكامل (كلفة عن عدد القيود المطبوعة)، وسعر ثابت لكل بحث قدره 00•2 دولار•
الكلفة = (00•0 * أ) + (58•3 * 2) + 00•2 دولار•
تعرض عناوين البحوث مجاناً للسماح للمستفيد باختيار المقالات ذات العلاقة من قائمة العناوين وتجنب غير الملائمة منها• هذه العملية مقيدة، لتغطية كلفة المخرجات العالية للبحث الواحد•
الوصول مباشر للمنتج CAS ضمن خدمة SCifinder
المزايا الأساسية:
1• مصمم بالأساس ليساند احتياجات المستفيدين النهائيين•
2• اتفاقية خاصة مع CAS (لأن الاتفاقية المبرمة مع STN غير قابلة للتطبيق) بشراء ما لايقل عن 003 استخدام كمقدمة سنوية وبسعر 059•5 دولار، ويسند بحزمة إضافية للسنة التاليةإن انتهت الأولى قبل المدة (قبل السنة)•
3• من السهولة إدارة البرمجيات الخاصة التي يوفرها CAS من قبل المستفيدين، كما تشبه أداة التصفح (Browser) الخاصة بالإنترنيت، لتوفر اتصالات الإنترنيت•
4• يسمح بالبحوث البسيطة، وتشبه تحديداتها ما توفرهSTN Easy إلا أنها أكثر مهارة، فبالإمكان إنجاز استفسار (أOR ب) AND (ج OR د)، باعتبار ب ود مرادفات لـ (أ أو ج) بالتتابع•
5• تتشابه مع نسخة STN Easy في عرض العناوين فقط واختيار الملائم منها، ولكن دون تأثير على الكلف•
6• يسمح Scifinder بالتحليل المجاني لنتائج البحث، عن طريق سنة النشر، نوع الوثيقة، واللغة، كما يسمح بالرسوم البيانية لتحليل التكرار، وكذلك توسيع وتطوير إضافي للنتائج، وتتم عملية التطوير بطريق تضييق البحث التي لا يسمح بها Scifinder ولا STN Easy خلال عملية البحث•
7• إضافة إلى إمكانية الوصول إلى CA Plus فإن Scifinder تسمح بالدخول إلى قاعدة بيانات CAS registery بالهياكل الكيماوية والهياكل الفرعية، وأرقام التسجيلات، وأسماء التركيبات الكيماوية جميعها، بالإضافة إلى المصادر التجارية الكيماوية، وجدول محتويات دوريات الكيمياء المهمة، وطلب نسخ من المقالات•
كلفة البحث
لا تحسب كلفة الوقت المستغرق في الاتصال، ولا على عدد القيود المطبوعة، ولكن عن كل عملية استرجاع بسعر ثابت هو 38•91$•
يجري عليه خصم عند شراء عدد كبير من الأعمال "Tasks"، أي كل عمل يقل بـ 56•1دولار فيكون المبلغ عن كل استرجاع هو الكلفة الإجمالية "دولار"= (00•0 * أ) + (00•0 * ب) + (00•0 * 2) + 38•91•
وبالمبلغ نفسه (للمهمة الواحدة) يوفر Scifinder المصادر ذات العلاقة من قاعدة بيانات CA Plus بالإضافة إلى القيود المتوافرة في قاعدة CAS registry، بعرضها عن طريق الضغط على أرقام (CASRN) CAS registry المدرجة في المصادر
يمكن الوصول (بالرغم من اختلاف العملية) بطريقة البحث الآلي المباشر التقليدية للمضيف STN، لكن بسبب ضرورة الانتقال إلى قاعدة البيانات الخاصة CAS registry فإن كلفاً إضافية تترتب على ذلك، وتعطي الأولوية إلى Scifinder فيما يخص استرجاع الموضوع الناتج عن العديد من CASRN دون أسماء مركباتها الكيمياوية ذ ات العلاقة•
تحليل الكلف (مقارنة)
بين الوصف أعلاه بعض مظاهر القوة والقصور في الخدمات، ولإلقاء الضوء على الاختلافات فيما بينها ندرج في الجدول أدناه تفاصيل سعر كل خدمة:








الاستنتاجات
نستنتج من التحليل السابق أن:
STN Easy هو الخيار الأفضل بالنسبة للبحوث البسيطة التي يمكن حلها بتعبير منطقي بسيط، لكن إلى حد خمس إصابات (Hits)، وإجراء بحث واحد ضمن Scifinder يتضمن إصابة إلى أربع إصابات يؤدي إلى إهدار وتبذير وإسراف، لوجود STN Easy الأقل كلفة، لذا من المستحسن اختيار Scifinder للبحث الذي يتضمن أكثر من خمس إصابات Hits)) لكون كلفته أقل، لأن كلفة ست إصابات في STN Easy هو (6 * 58•3) + 00•2 = 01•52دولار•
ومن الواضح أن أكثر من أربع إلى خمس إصابات باستخدام STN Easy "يعني تكلفة 00•2دولار فقط، فمن الناحية الاقتصادية يتم تكرار البحث في Scifinder بكلفة 38•91دولار بصرف النظر عن عدد الإصابات، ومع ذلك فلو علمنا أن عدد الإصابات أعلى من حدود المجموعة المؤلفة من خمسة، فإن البدء مباشرة مع Scifinder هو الأفضل•
ويستحسن دائماً البحث في STN Easy للاستفادة من خيارات التعابير المنطقية المقدمة من قبل الخدمة المذكورة وScifinder فالكلفة ستكون دولارين فقط مع STN Easy مقارنة بالسعر 38•91دولارعن كل مهمة (Task) مع Scifinder• أما بالنسبة إلى الاستفسارات التي تتطلب العديد من الكلمات المفتاحية أو حينما يوسع البحث فلن تكون STN Easy أو Scifinder ملائمتين، فالاثنتان يتطلب فيهما استخدام بحوث عديدة• والاسترجاع باسم المؤلف، يسمح به Scifinder بنسبة خمسة أسماء لكل مهمة كحد أعلى، بينما يتطلب استخدام ستة مؤلفين، مهمتين، وأحد عشر مؤلفاً، مقابل ثلاث مهام، وينطبق هذا مع أرقام CAS registry (خمسة مؤلفين في مهمة واحدة)• سيكون لغة الأوامر Command Language ملائمة جداً، وأكثر ملاءمة من غير ذلك•• فحتى لو زادت المهمات عن ثلاث فإنها لن تكون مكلفة جداً، واختيار إحدى لغات الأمر الثلاث تكون كلفة طبع القيد الواحد 11•2دولار فكلفة البحث في CA Plus القياسي هي 53•2دولار للدقيقة وهي أقل تكلفة من HCA Plus، كما أن المبلغ 05•0دولار للدقيقة أعلى كلفة من ZCA Plus، وأكـثر كلـفة بـ 33•1دولار من HCA plus•
يُوصى بهذا الخيار في الحالات التي تتطلب الاستفادة من لغة الأمر التقليدية، بالإضافة إلى الحالات التي يكون فيها عدد الكلمات المفتاحية ووقت الاسترجاع غير معروف (لا يمكن التنبؤ به)•
إن سعر الدقيقة للبحث في HCA Plus هو 53•2دولار وهو أكثر كلفة من CA Plus، لكن استخدام الكلمات المفتاحية لا تترتب عليها أية تكلفة، ولذلك فهي مناسبة جداً بالنسبة للاستفسارات التي تكثر فيها الكلمات المفتاحية مع ملاحظة الوقت المستغرق (كلمات كثيرة وقت أطول، كلمات قليلة وقت أقل)•
كلفة طبع النتائج ستكون عالية بالبحث الآلي المباشر مع HCA Plus إذ يسجل العداد وقت الطبع، فتكلفة خمس دقائق من الوقت المستغرق في الاتصال هو (52•41دولار)، وعشر دقائق (52•82دولار)، وخمس عشرة دقيقة (57•24دولار)•
كما أن وقت الاتصال لا يحتسب باستخدام ZCA Plus، إلا أنه غير ملائم عند استخدام العديد من الاستفسارات المتضمنة العديد من الكلمات المفتاحية، فتكلفة عشر كلمات مفتاحية هو 03•71 و59•52دولار لكل خمس عشرة كلمة، 06•43دولار لكل عشرين كلمة•••• وهكذا•
لا تحتسب CAS كلفة الكلمات المفتاحية جميعها، وإنما كلفة كلمة واحدة بغض النظر عن عدد الكلمات المفتاحية الموجودة، إذ تفيد هذه الخاصية في حالات التجوال بين عشر أو أكثر من الكلمات دون إضافة كلفتها على النتائج المطبوعة (ليس للعداد تأثير في هذه الحالة)• إن تحديد مجموعة من الكلمات المفتاحية في التحليل أعلاه تم التركيز على عناصر تكلفة البحوث المنجزة في قاعدة بيانات CA على المضيف STN باستخدام: "Messenger Command Language, STN Easy, Scifinder"• والأفضل لأية مؤسسة هو توفير الخيارات، والاتفاقيات، والاتصالات، والبرمجيات جميعها، على أن تكون سمات كل خيار مألوفة للمتخصصين والمستفيدين النهائيين بالرغم من عدم حاجة الأخيرين إلى أن يلموا بالتفاصيل المتعلقة بطرق البحث الآلي المباشر التقليدية، لأنهم في العادة يبحثون في قواعد بيانات CA عن طريق Scifinder و STN Easy، بينما لغة الأمر في أيدي ماهرة من متخصصي المعلومات•
الهوامش
1- Toth, Tibor. Searching CA- by/ Tibor Toth & Sonja Katanec Francove, Pliva D.D. in ONLINE. july/ August 1999. Pp35- 38.
2- Internet Site: STN Easy, Dialog. net.
3- CA on Silver platter. Silver Platter Information System, 1989.
4- CA on CD. CAS, 1999.