البحث عن المعلومات المهنية على شبكة الإنترنت. البرامج والخدمات للبحث المهني

البحث عن المعلومات المهنية على شبكة الإنترنت.  البرامج والخدمات للبحث المهني
البحث عن المعلومات المهنية على شبكة الإنترنت. البرامج والخدمات للبحث المهني

التحقق من اللقب عبر عشرات الخدمات في وقت واحد، وإحصاء عمليات إعادة النشر على فيسبوك وتصور اتصالات حساب تويتر.

يعد تحليل محتوى الوسائط الاجتماعية موضوعًا ساخنًا بين الشركات الناشئة. تظهر المزيد والمزيد من الخدمات للبحث عن المشاركات والأشخاص كل عام. لكن الكثير منها إما يختفي بسرعة، أو يتوفر في حالة غير مكتملة، أو يكون استخدامه مكلفًا.

تحتوي هذه المادة على عدد قليل منها مما يتيح لك الحصول بسرعة وحرية على معلومات مفيدة حقًا أو مجرد معلومات مثيرة للاهتمام.

1. ابحث عن الملفات الشخصية

نظام البحث واشيسمح لك بالبحث عن الملف الشخصي لشخص ما في أربع عشرات من الخدمات، بما في ذلك المواقع الإلكترونية للجامعات الرائدة في العالم وقاعدة البيانات الجنائية الأمريكية:

لسوء الحظ، بعض المواقع التي يمكنك تحديد المربعات الخاصة بها لم تعد تعمل. على سبيل المثال، تم إغلاق Google Uncle Sam منذ 5 سنوات. ولكن على الرغم من هذا وغيره من عضادات سنيتش - خدمة مفيدةمما يتيح لك توفير الوقت بشكل كبير عند البحث عن معلومات حول شخص ما.

إذا تم عرض شاشة فارغة لبعض الخدمات بدلاً من الكتل التي تحتوي على نتائج البحث، فيجب عليك اتباع الرابط لعرضها افتح نافذة جديدة:

2. ابحث عن علامات التصنيف

انه سهل الاستخدام. تحتاج إلى إدخال علامة التصنيف المطلوبة في نموذج البحث وفي ثانية ستظهر قائمة بالمشاركات الحديثة التي تم وضع علامة عليها في ست شبكات اجتماعية:

3. تحليل التغريدات الأخيرة

تتيح لك الخدمة الحصول على قائمة بآخر مائة تغريدة تحتوي على كلمة البحث أو الهاشتاج أو اسم الحساب. وتعرف أيضًا على بعض المعلومات التحليلية عن الأشخاص الذين قاموا بهذه التغريدات ووقت إنشائها:

لنفترض أنك تريد تحديد المستخدم الذي تسبب في عدد كبير بشكل غير عادي من النقرات على مقال من Twitter. نحن نلقي نظرة على أحدث 100 تغريدة ونرى أي من الأشخاص الذين ذكروا المفهوم الأصلي لديهم أكبر عدد من المتابعين:

أصحاب الاشتراك المدفوعيتوفر عدد كبير من التغريدات للتحليل:

4. تحليل حساب تويتر

على Mentionappيمكنك إدخال اسم الحساب والحصول على معلومات عنه (من يعيد التغريد في أغلب الأحيان، وما هي علامات التصنيف التي يستخدمها، وما إلى ذلك) في شكل مخطط اتصال:

5. ابحث عن التغريدات على الخريطة

إذا نقرت على أي مكان على الخريطة، يمكنك قراءة أحدث التغريدات التي تم إنشاؤها في مكان قريب:

6. عدد الإشارات على الشبكات الاجتماعية

عدد المشاركاتيساعد على تقييم مدى شعبية مقال/موقع على الشبكات الاجتماعية. تقوم بإدخال عنوان URL وفي بضع ثوانٍ توجد إحصائيات الإشارات على Facebook وGoogle+ وPinterest وLinkedIn وStumble Upon:

7. ابحث في المنتديات

قارئ اللوحةهو محرك بحث للمنتديات ولوحات الرسائل:

أظهر تقييم حجم الكارثة أن هناك ما يقرب من 4 ردود على هذه البوابة لكل مقيم في روسيا.

8. نقوم باختراق تسجيل الدخول عبر الشبكات الاجتماعية

نذهب إلى knowem.com وندخل لقب الشخص. ردًا على ذلك، نتلقى معلومات حول الخدمات التي تم التسجيل عليها:

9. تحديد اسم الشخص عن طريق البريد الإلكتروني

إذا كنت لا تزال تبحث عن الناس عن طريق قتلهم العناوين البريديةعلى جوجل، فيجب عليك التخلي عن هذه الطريقة. بعد كل شيء، هناك pipl.com. تقوم بإدخال بريدك الإلكتروني (الاسم المستعار) وتحصل على قائمة بالملفات الشخصية على الشبكات الاجتماعية:

المعلومات ليست دقيقة أو كاملة دائمًا، لكن الخدمة مفيدة للغاية.

هذا كل شئ. كان الأمر يستحق الحديث عن Socialmention (تحليل غير مكتمل للمراجعات)، وYomapic (البحث عن الصور من VK وInstagram على الخريطة) وyandex.

لعمليات البحث المهنية على الإنترنت التي تحتاجها برامج متخصصةبالإضافة إلى محركات البحث المتخصصة وخدمات البحث.

البرامج

http://dr-watson.wix.com/home – البرنامج مصمم لاستكشاف المصفوفات معلومات نصيةمن أجل التعرف على الكيانات والارتباطات فيما بينها. نتيجة العمل هي تقرير عن الكائن قيد الدراسة.

http://www.fmsasg.com/ - أحد أفضل البرامج في العالم لتصور الاتصالات والعلاقات Sentinel Vizualizer. قامت الشركة بإضفاء الطابع الروسي على منتجاتها بالكامل وتوصيلها الخط الساخنبالروسية.

http://www.newprosoft.com/ - "Web Content Extractor" هو أقوى برنامج سهل الاستخدام لاستخراج البيانات من مواقع الويب. كما أن لديها عنكبوت ويب مرئي فعال.

موقع سبوتنيك ليس له نظائرها في العالم حزمة البرامجمما يتيح لك البحث ومعالجة نتائجه على شبكة الإنترنت المرئية وغير المرئية باستخدام جميع محركات البحث اللازمة للمستخدم.

WebSite-Watcher – يسمح لك بمراقبة صفحات الويب، بما في ذلك الصفحات المحمية بكلمة مرور، ومنتديات المراقبة، وخلاصات RSS، ومجموعات الأخبار، والملفات المحلية. يمتلك نظام قويالمرشحات. تتم المراقبة تلقائيًا ويتم تسليمها في شكل سهل الاستخدام. البرنامج ذو الوظائف المتقدمة يكلف 50 يورو. يتم تحديثها باستمرار.

http://www.scribd.com/ هو النظام الأساسي الأكثر شعبية في العالم ويستخدم بشكل متزايد في روسيا لنشر أنواع مختلفة من المستندات والكتب وما إلى ذلك. للوصول المجاني باستخدام محرك بحث مناسب جدًا للعناوين والموضوعات وما إلى ذلك.

http://www.atlasti.com/ هي الأداة الأقوى والأكثر فعالية لتحليل المعلومات النوعية المتاحة للمستخدمين الأفراد والشركات الصغيرة وحتى المتوسطة الحجم. البرنامج متعدد الوظائف وبالتالي فهو مفيد. فهو يجمع بين القدرة على إنشاء بيئة معلومات موحدة للعمل مع مختلف ملفات النصوص والجداول والصوت والفيديو ككل واحد، بالإضافة إلى أدوات التحليل النوعي والتصور.

Ashampoo ClipFinder HD – حصة متزايدة من تدفق المعلومات تأتي من الفيديو. وبناء على ذلك، يحتاج ضباط الاستخبارات التنافسية إلى أدوات تسمح لهم بالعمل بهذا الشكل. أحد هذه المنتجات هو العرض فائدة مجانية. يسمح لك بالبحث عن مقاطع الفيديو بناءً على معايير محددة على مواقع تخزين ملفات الفيديو مثل YouTube. البرنامج سهل الاستخدام، ويعرض جميع نتائج البحث في صفحة واحدة مع معلومات مفصلة، ​​والعناوين، والمدة، والوقت الذي تم فيه تحميل الفيديو على وحدة التخزين، وما إلى ذلك. هناك واجهة روسية.

http://www.advego.ru/plagiatus/ – تم إنشاء البرنامج بواسطة مُحسِّني تحسين محركات البحث (SEO)، ولكنه مناسب تمامًا كأداة ذكاء على الإنترنت. توضح السرقة الأدبية درجة تفرد النص ومصادر النص ونسبة تطابق النص. يتحقق البرنامج أيضًا من تفرد عنوان URL المحدد. البرنامج مجاني.

http://neiron.ru/toolbar/ - يتضمن وظيفة إضافية للجمع بين بحث Google وYandex، كما يسمح أيضًا بإجراء تحليل تنافسي يعتمد على تقييم فعالية المواقع و الإعلانات السياقية. تم تنفيذه كمكون إضافي لـ FF وGC.

http://web-data-extractor.net/ هو حل عالمي للحصول على أي بيانات متاحة على الإنترنت. يتم إعداد قطع البيانات من أي صفحة ببضع نقرات بالماوس. كل ما عليك فعله هو تحديد منطقة البيانات التي تريد حفظها وسيقوم Datacol تلقائيًا بتحديد صيغة لاستبعاد هذه الكتلة.

CaptureSaver هي أداة بحث احترافية على الإنترنت. ببساطة لا يمكن الاستغناء عنه برنامج العمل، مما يسمح لك بالتقاط وتخزين وتصدير أي معلومات عبر الإنترنت، بما في ذلك ليس فقط صفحات الانترنتوالمدونات، وأيضًا أخبار RSS والبريد الإلكتروني والصور وغير ذلك الكثير. لديه أوسع وظائف، بديهية واجهة واضحةوسعر سخيف.

http://www.orbiscope.net/en/software.html – نظام مراقبة الويب بأسعار أكثر من المعقولة.

http://www.kbcrawl.co.uk/ - برمجةللعمل، بما في ذلك على "الإنترنت غير المرئي".

http://www.copernic.com/en/products/agent/index.html – يتيح لك البرنامج البحث باستخدام أكثر من 90 محركات البحث، أكثر من 10 معلمات. يسمح لك بدمج النتائج وإزالة التكرارات وحظر الروابط المعطلة وإظهار النتائج الأكثر صلة. يأتي في إصدارات مجانية وشخصية ومهنية. يستخدمه أكثر من 20 مليون مستخدم.

Maltego هو برنامج جديد بشكل أساسي يسمح لك بإقامة علاقة بين الموضوعات والأحداث والأشياء في الحياة الواقعية وعلى الإنترنت.

خدمات

جديد – متصفح ويب مزود بالعشرات من الأدوات المثبتة مسبقًا لـ OSINT.

- مجمع محركات بحث فعال للعثور على الأشخاص باللغة الروسية الرئيسية في الشبكات الاجتماعية.

https://hunter.io/ هي خدمة فعالة لاكتشاف البريد الإلكتروني والتحقق منه.

https://www.whatruns.com/ – سهل الاستخدام، ولكن الماسح الضوئي الفعال، مما يسمح لك باكتشاف ما يعمل وما لا يعمل على موقع الويب وما هي الثغرات الأمنية فيه. تم تنفيذه أيضًا كمكون إضافي لـ Chrom.

https://www.crayon.co/ عبارة عن منصة أمريكية للميزانية للسوق والاستخبارات التنافسية على الإنترنت.

http://www.cs.cornell.edu/~bwong/octant/ - معرف المضيف.

https://iplogger.ru/ – خدمة بسيطة ومريحة لتحديد عنوان IP الخاص بشخص آخر.

http://linkurio.us/ هو منتج جديد قوي للعاملين في مجال الأمن الاقتصادي ومحققي الفساد. يعالج ويصور كميات هائلة من المعلومات غير المنظمة من المصادر المالية.

http://www.intelsuite.com/en - منصة على الإنترنت باللغة الإنجليزية للاستخبارات والمراقبة التنافسية.

http://yewno.com/about/ هو أول نظام تشغيل لترجمة المعلومات إلى معرفة وتصور المعلومات غير المنظمة. يدعم حاليًا اللغة الإنجليزية والفرنسية والألمانية والإسبانية والبرتغالية.

https://start.avalancheonline.ru/landing/?next=%2F – خدمات التنبؤ والتحليل بقلم أندريه ماسالوفيتش.

https://www.outwit.com/products/hub/ - مجموعة كاملة من البرامج المستقلة للعمل الاحترافي في الويب 1.

https://github.com/search?q=user%3Acmlh+maltego - ملحقات Maltego.

http://www.whoishostingthis.com/ – محرك بحث للاستضافة وعناوين IP وما إلى ذلك.

http://appfollow.ru/ - تحليل التطبيقات بناءً على المراجعات وتحسينات ASO والمواضع في القمم ونتائج البحث في App Store وGoogle Play وWindows Phone Store.

http://spiraldb.com/ هي خدمة يتم تنفيذها كمكون إضافي لـ Chrom، والتي تتيح لك الحصول على الكثير من المعلومات القيمة حول أي مورد إلكتروني.

https://millie.northernlight.com/dashboard.php?id=93 - خدمة مجانيةوجمع وتنظيم المعلومات الأساسية حسب الصناعة والشركة. من الممكن استخدام لوحات المعلومات بناءً على تحليل النص.

http://byratino.info/ – جمع البيانات الواقعية من المصادر المتاحة للجمهور على شبكة الإنترنت.

http://www.datafox.co/ – تقوم منصة CI بجمع وتحليل المعلومات عن الشركات التي تهم العملاء. هناك التجريبي.

https://unwiredlabs.com/home - تطبيق متخصص مزود بواجهة برمجة التطبيقات (API) للبحث عن طريق تحديد الموقع الجغرافي لأي جهاز متصل بالإنترنت.

http://visualping.io/ – خدمة لمراقبة مواقع الويب، وقبل كل شيء الصور والصور المتوفرة عليها. حتى لو ظهرت الصورة لثانية واحدة، فستكون كذلك بريد إلكترونيمشترك يحتوي على مكون إضافي لمتصفح Google Chrome.

http://spyonweb.com/ هي أداة بحث تسمح بإجراء تحليل متعمق لأي مورد إنترنت.

http://bigvisor.ru/ – الخدمة تسمح لك بالتتبع شركات الإعلانلقطاعات معينة من السلع والخدمات، أو مؤسسات محددة.

http://www.itsec.pro/2013/09/microsoft-word.html - تعليمات للاستخدام بواسطة Artem Ageev برامج ويندوزلاحتياجات الاستخبارات التنافسية.

http://granoproject.org/ هي أداة مفتوحة المصدر مصدر الرمزللباحثين الذين يتتبعون شبكات الاتصالات بين الأفراد والمنظمات في السياسة والاقتصاد والجريمة وما إلى ذلك. يسمح لك بالاتصال بالمعلومات التي تم الحصول عليها من مصادر مختلفة وتحليلها وتصورها، بالإضافة إلى إظهار الروابط المهمة.

http://imgops.com/ – خدمة استخراج البيانات الوصفية من الملفات الرسوميةوالعمل معهم.

http://sergeybelove.ru/tools/one-button-scan/ – ماسح ضوئي صغير عبر الإنترنت لفحص الثغرات الأمنية في مواقع الويب والموارد الأخرى.

http://isce-library.net/epi.aspx – خدمة البحث عن المصادر الأولية باستخدام جزء من النص باللغة الإنجليزية

https://www.rivaliq.com/ هي أداة فعالة لإجراء الاستخبارات التنافسية في الأسواق الغربية، وخاصة الأوروبية والأمريكية، للسلع والخدمات.

http://watchthatpage.com/ هي خدمة تسمح لك بجمع معلومات جديدة تلقائيًا من موارد الإنترنت الخاضعة للمراقبة. الخدمة مجانية.

http://falcon.io/ هو نوع من التقارير للويب. إنه ليس بديلاً عن Rapportive، ولكنه يوفر أدوات إضافية. في المقابل، توفر Rapportive ملفًا تعريفيًا عامًا للشخص، كما لو تم لصقه معًا من بيانات من الشبكات الاجتماعية والإشارات الموجودة على الويب http://watchthatpage.com/ - وهي خدمة تسمح لك بجمع معلومات جديدة تلقائيًا من الموارد الخاضعة للمراقبة الإنترنت. الخدمة مجانية.

https://addons.mozilla.org/ru/firefox/addon/update-scanner/ - الوظيفة الإضافية لمتصفح فايرفوكس. يراقب تحديثات صفحة الويب. مفيد لمواقع الويب التي لا تحتوي على خلاصات أخبار (Atom أو RSS).

http://agregator.pro/ – مجمع بوابات الأخبار والإعلام. يستخدم من قبل المسوقين والمحللين وما إلى ذلك. لتحليل تدفقات الأخبار حول موضوعات معينة.

http://price.apishops.com/ – خدمة ويب آلية لمراقبة الأسعار لمجموعات منتجات محددة ومتاجر محددة عبر الإنترنت ومعلمات أخرى.

http://www.la0.ru/ هي خدمة ملائمة وذات صلة لتحليل الروابط والروابط الخلفية لمورد الإنترنت.

يعد www.recordedfuture.com أداة قوية لتحليل البيانات وتصورها، ويتم تنفيذها كخدمة عبر الإنترنت مبنية على الحوسبة السحابية.

http://advse.ru/ هي خدمة تحمل شعار "اكتشف كل شيء عن منافسيك". يتيح لك الحصول على مواقع المنافسين وفقًا لاستعلامات البحث وتحليل الحملات الإعلانية للمنافسين في Google وYandex.

http://spyonweb.com/ – تتيح لك الخدمة تحديد المواقع ذات الخصائص نفسها، بما في ذلك تلك التي تستخدم نفس معرفات خدمة إحصاءات Google Analytics وعناوين IP وما إلى ذلك.

http://www.connotate.com/solutions – مجموعة من المنتجات للذكاء التنافسي وإدارة تدفقات المعلومات وتحويل المعلومات إلى أصول معلومات. وهو يشتمل على منصات معقدة وخدمات بسيطة ورخيصة تسمح بالمراقبة الفعالة إلى جانب ضغط المعلومات والحصول على النتائج الضرورية فقط.

http://www.clearci.com/ - منصة استخباراتية تنافسية للشركات ذات الأحجام المختلفة بدءًا من الشركات الناشئة والشركات الصغيرة وحتى شركات Fortune 500 التي تم حلها كـ Saas.

http://startingpage.com/ عبارة عن وظيفة إضافية من Google تتيح لك البحث على Google دون تسجيل عنوان IP الخاص بك. يدعم بشكل كامل جميع إمكانيات بحث جوجل، بما في ذلك باللغة الروسية.

http://newspapermap.com/ هي خدمة فريدة ومفيدة جدًا لضابط استخبارات تنافسي. يربط تحديد الموقع الجغرافي مع محرك بحث الوسائط عبر الإنترنت. أولئك. قمت بتحديد المنطقة التي تهتم بها، أو حتى المدينة، أو اللغة، وشاهد المكان على الخريطة وقائمة الإصدارات الإلكترونية من الصحف والمجلات، وانقر على الزر المناسب واقرأ. يدعم اللغة الروسية، واجهة سهلة الاستخدام للغاية.

http://infostream.com.ua/ هو نظام مريح للغاية لمراقبة الأخبار "Infostream"، يتميز باختيار من الدرجة الأولى ويمكن الوصول إليه بسهولة من أي محفظة، من أحد كلاسيكيات البحث على الإنترنت، D.V Lande.

http://www.instapaper.com/ هي أداة بسيطة جدًا وفعالة لحفظ صفحات الويب الضرورية. يمكن استخدامه على أجهزة الكمبيوتر وأجهزة iPhone وiPad وما إلى ذلك.

http://screen-scraper.com/ - يسمح لك باستخراج جميع المعلومات تلقائيًا من صفحات الويب، وتنزيل الغالبية العظمى من تنسيقات الملفات، وإدخال البيانات تلقائيًا في نماذج مختلفة. يحفظ الملفات والصفحات التي تم تنزيلها في قواعد البيانات، ويؤدي العديد من المهام الأخرى للغاية وظائف مفيدة. يعمل على جميع المنصات الرئيسية، ويحتوي على إصدارات احترافية مجانية وقوية للغاية تعمل بكامل طاقتها.

http://www.mozenda.com/ - وجود عدة خطط التعريفةوخدمة ويب متعددة الوظائف لمراقبة الويب وتوصيل المعلومات اللازمة للمستخدم من مواقع مختارة، وهي متاحة حتى للشركات الصغيرة.

http://www.recipdonor.com/ - تتيح لك الخدمة مراقبة كل ما يحدث على مواقع المنافسين تلقائيًا.

http://www.spyfu.com/ – وهذا إذا كان منافسيك أجانب.

www.webground.su هي خدمة لمراقبة Runet تم إنشاؤها بواسطة محترفي البحث على الإنترنت، والتي تتضمن جميع مقدمي المعلومات والأخبار الرئيسيين وما إلى ذلك، وهي قادرة على ضبط إعدادات المراقبة الفردية لتناسب احتياجات المستخدم.

محركات البحث

https://www.idmarch.org/ هو أفضل محرك بحث للأرشيف العالمي لمستندات pdf من حيث الجودة. حاليًا، تمت فهرسة أكثر من 18 مليون مستند بتنسيق pdf، بدءًا من الكتب وحتى التقارير السرية.

http://www.marketvisual.com/ هو محرك بحث فريد يسمح لك بالبحث عن المالكين والإدارة العليا بالاسم الكامل، أو اسم الشركة، أو المنصب، أو مزيج من ذلك. لا تحتوي نتائج البحث على الكائنات التي تبحث عنها فحسب، بل تحتوي أيضًا على روابطها. مصممة في المقام الأول للبلدان الناطقة باللغة الإنجليزية.

http://worldc.am/ هو محرك بحث للصور الفوتوغرافية التي يمكن الوصول إليها مجانًا والمرتبطة بتحديد الموقع الجغرافي.

https://app.echosec.net/ هو محرك بحث متاح للعامة ويصف نفسه بأنه الأداة التحليلية الأكثر تقدمًا لمحترفي إنفاذ القانون والأمن والاستخبارات. يتيح لك البحث عن الصور المنشورة على مواقع مختلفة، المنصات الاجتماعيةوعلى الشبكات الاجتماعية فيما يتعلق بإحداثيات تحديد الموقع الجغرافي المحددة. يوجد حاليًا سبعة مصادر بيانات متصلة. وبحلول نهاية العام سيكون عددهم أكثر من 450. شكرًا لديمنتي على النصيحة.

http://www.quandl.com/ هو محرك بحث لسبعة ملايين قاعدة بيانات مالية واقتصادية واجتماعية.

http://bitzakaz.ru/ – محرك بحث للمناقصات والأوامر الحكومية مع وظائف مدفوعة إضافية

Website-Finder - يتيح لك العثور على المواقع التي لا يفهرستها Google بشكل جيد. القيد الوحيد هو أنه يبحث فقط في 30 موقعًا لكل كلمة رئيسية. البرنامج سهل الاستخدام.

http://www.dtsearch.com/ هو محرك بحث قوي يسمح لك بمعالجة تيرابايت من النص. يعمل على سطح المكتب والويب والإنترانت. يدعم كلا من البيانات الثابتة والديناميكية. يتيح لك البحث في جميع برامج MS Office. يتم إجراء البحث باستخدام العبارات والكلمات والعلامات والفهارس وغير ذلك الكثير. محرك البحث الموحد الوحيد المتاح. لديها إصدارات مدفوعة ومجانية.

http://www.strategator.com/ - يبحث ويصفي ويجمع المعلومات حول الشركة من عشرات الآلاف من مصادر الويب. عمليات البحث في الولايات المتحدة الأمريكية وبريطانيا العظمى ودول المجموعة الاقتصادية الأوروبية الكبرى. إنه ذو صلة كبيرة وسهل الاستخدام ومجاني و الخيار المدفوع(14 دولارًا شهريًا).

http://www.shodanhq.com/ هو محرك بحث غير عادي. وفور ظهوره حصل على لقب "جوجل للهاكرز". لا يبحث عن الصفحات، بل يحدد عناوين IP وأنواع أجهزة التوجيه وأجهزة الكمبيوتر والخوادم ومحطات العمل الموجودة في عنوان معين، ويتتبع سلاسل خوادم DNS ويسمح لك بتنفيذ العديد من الخوادم الأخرى ميزات مثيرة للاهتمامللذكاء التنافسي.

http://search.usa.gov/ – محرك بحث للمواقع و قواعد البيانات المفتوحةجميع الوكالات الحكومية الأمريكية. تحتوي قواعد البيانات على الكثير من الأمور العملية معلومات مفيدة، بما في ذلك للاستخدام في بلدنا.

http://visual.ly/ - يتم استخدام التصور اليوم بشكل متزايد لعرض البيانات. هذا هو أول محرك بحث للرسوم البيانية على شبكة الإنترنت. إلى جانب محرك البحث، تحتوي البوابة على أدوات قوية لتصور البيانات ولا تتطلب مهارات برمجية.

http://go.mail.ru/realtime - ابحث عن مناقشات حول المواضيع والأحداث والأشياء والمواضيع في الوقت الحقيقي أو القابل للتخصيص. يعمل البحث الذي تم انتقاده بشدة سابقًا في Mail.ru بشكل فعال للغاية ويقدم نتائج مثيرة للاهتمام وذات صلة.

تم إطلاق Zanran للتو، ولكنه يعمل بالفعل بشكل رائع، وهو محرك البحث الأول والوحيد للبيانات التي يتم استخراجها منه ملفات PDF, جداول اكسلالبيانات على صفحات HTML.

http://www.ciradar.com/Competitive-Analogy.aspx هو أحد أفضل أنظمة استرجاع المعلومات في العالم للاستخبارات التنافسية على شبكة الإنترنت العميقة. يسترد جميع أنواع الملفات تقريبًا بجميع التنسيقات المتعلقة بالموضوع محل الاهتمام. تم تنفيذها كخدمة ويب. الأسعار أكثر من معقولة.

http://public.ru/ – البحث الفعال والتحليل المهني للمعلومات وأرشيف الوسائط منذ عام 1990. تقدم مكتبة الوسائط عبر الإنترنت مجموعة واسعة من خدمات المعلومات: بدءًا من الوصول إلى الأرشيف الإلكتروني للمنشورات الإعلامية باللغة الروسية والمراجعات الصحفية المواضيعية الجاهزة وحتى المراقبة الفردية والبحث التحليلي الحصري المستند إلى المواد الصحفية.

Cluuz هو محرك بحث شاب إمكانيات واسعةللذكاء التنافسي، وخاصة على شبكة الإنترنت الناطقة باللغة الإنجليزية. لا يسمح لك بالعثور على الاتصالات فحسب، بل يسمح لك أيضًا بتصور وإنشاء اتصالات بين الأشخاص والشركات والمجالات ورسائل البريد الإلكتروني والعناوين وما إلى ذلك.

www.wolframalpha.com - محرك بحث الغد. استجابة لطلب بحث، فإنه يوفر معلومات إحصائية وواقعية متاحة عن كائن الطلب، بما في ذلك المعلومات المرئية.

www.ist-budget.ru - بحث عالمي في قواعد بيانات المشتريات الحكومية والمناقصات والمزادات وما إلى ذلك.

البحث عن المعلومات المهنية على شبكة الإنترنت

يعد البحث على الإنترنت عنصرًا مهمًا في العمل على الإنترنت. من غير المرجح أن يعرف أي شخص على وجه اليقين العدد الدقيق لموارد الويب على الإنترنت الحديثة. وعلى أية حال فإن العدد بالمليارات. لكي تكون قادرًا على استخدام المعلومات المطلوبة في لحظة معينة، بغض النظر عن أغراض العمل أو الترفيه، تحتاج أولاً إلى العثور عليها في محيط الموارد المتجدد باستمرار.

لكي يكون البحث على الإنترنت ناجحا، يجب استيفاء شرطين: يجب صياغة الاستفسارات بشكل جيد ويجب طرحها في الأماكن المناسبة. بمعنى آخر، يتعين على المستخدم، من ناحية، أن يكون قادرًا على ترجمة اهتماماته البحثية إلى اللغة استعلام بحثومن ناحية أخرى، المعرفة الجيدة بمحركات البحث وأدوات البحث المتاحة ومزاياها وعيوبها، مما سيسمح لك باختيار أدوات البحث الأكثر ملاءمة في كل حالة على حدة.

في الوقت الحالي، لا يوجد مصدر واحد يلبي جميع متطلبات البحث على الإنترنت. ولذلك، إذا كنت تأخذ بحثك على محمل الجد، فسيتعين عليك حتماً استخدام أدوات مختلفة، وذلك باستخدام كل منها في الحالة الأنسب.

أساسي أدوات البحث على الإنترنتيمكن تقسيمها إلى المجموعات الرئيسية التالية:

محركات البحث؛

أدلة الويب؛

موارد المساعدة؛

البرامج المحلية للبحث في الإنترنت.

أدوات البحث الأكثر شعبية هيمحركات البحث– ما يسمى بمحركات البحث على الإنترنت (Search Engines). إن القادة الثلاثة الأوائل على المستوى العالمي مستقرون تمامًا - جوجل وياهو! وبنج. في العديد من البلدان، تتم إضافة محركات البحث المحلية الخاصة بها، المحسنة للعمل مع المحتوى المحلي، إلى هذه القائمة. بمساعدتهم، يمكنك نظريًا العثور على أي كلمة محددة على صفحات ملايين المواقع. من وجهة نظر المستخدم، فإن العيب الرئيسي لمحركات البحث هو الوجود الحتميضجيج المعلوماتفي النتائج. هذا هو الاسم المعتاد للنتائج المضمنة في قائمة البحث لسبب أو لآخر ولا تتوافق مع الطلب.

على الرغم من الاختلافات العديدة، تعمل جميع محركات البحث على الإنترنت وفقًا لمبادئ مماثلة، ومن الناحية الفنية، تتكون من أنظمة فرعية مماثلة. الجزء الهيكلي الأول لمحرك البحث هو برامج خاصة، يستعمل ل البحث التلقائيوالفهرسة اللاحقة لصفحات الويب. تسمى هذه البرامج عادةً بالعناكب أو الروبوتات. إنهم ينظرون إلى كود صفحات الويب، ويجدون الروابط الموجودة عليها، وبالتالي يكتشفون صفحات ويب جديدة. هناك أيضا طريقة بديلةإدراج الموقع في الفهرس. توفر العديد من محركات البحث لأصحاب الموارد الفرصة لإضافة موقع إلى قاعدة بياناتهم بشكل مستقل. ومع ذلك، يتم بعد ذلك تنزيل صفحات الويب وتحليلها وفهرستها. وتتميز العناصر الهيكلية فيها، فهي تقع الكلمات الدالةويتم تحديد اتصالاتهم بالمواقع وصفحات الويب الأخرى. يتم أيضًا تنفيذ عمليات أخرى تكون نتيجتها تكوين قاعدة بيانات فهرس محرك البحث. قاعدة البيانات هذه هي العنصر الرئيسي الثاني لأي محرك بحث. في الوقت الحالي، لا توجد قاعدة بيانات فهرس واحدة كاملة تمامًا تحتوي على معلومات حول جميع محتويات الإنترنت. بسبب ال محركات البحث المختلفةيستخدم برامج مختلفةالبحث عن صفحات الويب وبناء فهرسها باستخدام خوارزميات مختلفة، يمكن أن تختلف قواعد بيانات فهرس محرك البحث بشكل كبير. تتم فهرسة بعض المواقع بواسطة العديد من محركات البحث، ولكن هناك دائمًا نسبة معينة من الموارد المضمنة في قاعدة بيانات محرك بحث واحد فقط. إن وجود مثل هذا الجزء الأصلي وغير المتداخل من الفهرس في كل محرك بحث يسمح لنا باستخلاص نتيجة عملية مهمة: إذا كنت تستخدم محرك بحث واحدًا فقط، حتى لو كان المحرك الأكبر، فسوف تفقد بالتأكيد نسبة معينة من الروابط المفيدة. .

الجزء التالي من محرك البحث على الإنترنت هو برامج البحث والفرز الفعلية. تحل هذه البرامج مهمتين رئيسيتين: أولاً، العثور على الصفحات والملفات في قاعدة البيانات التي تطابق الطلب الوارد، ثم فرز مصفوفة البيانات الناتجة وفقًا لمعايير مختلفة. يعتمد النجاح في تحقيق أهداف البحث إلى حد كبير على فعالية عملهم.

العنصر الأخير في محرك البحث على الإنترنت هو واجهة المستخدم. بالإضافة إلى المتطلبات المعتادة من الناحية الجمالية والملاءمة لأي موقع ويب، فإن واجهات محرك البحث لديها مطلب مهم آخر: يجب أن توفر أدوات متنوعة لإنشاء الاستعلامات وتوضيحها، بالإضافة إلى فرز النتائج وتصفيتها. تتمثل مزايا محركات البحث في التغطية الممتازة للمصادر والتحديث السريع نسبيًا لمحتوى قاعدة البيانات و اختيار موفق وظائف اضافيه.

الأداة الرئيسية للعمل مع محركات البحث هي الاستعلام.

تستخدم أيضًا لعمليات البحث على الإنترنت تطبيقات خاصة، مثبتة على الكمبيوتر المحلي. يمكن أن يكون مثل برامج بسيطةومجمعات معقدة للغاية للبحث عن البيانات وتحليلها. الأكثر شيوعًا هي مكونات البحث الإضافية للمتصفحات، ولوحات المتصفح المصممة للعمل مع خدمة بحث معينة، وحزم البحث الوصفي التي تتمتع بإمكانيات تحليل النتائج.

أدلة الويب - هذه هي الموارد التي يتم فيها تقسيم المواقع إلى فئات موضوعية. إذا كان المستخدم يعمل مع محركات البحث فقط من خلال الاستعلامات، فمن الممكن في الكتالوج عرض الأقسام المواضيعية بالكامل. والفرق الأساسي الثاني بين الدلائل ومحركات البحث التلقائية هو أنه، كقاعدة عامة، يشارك الأشخاص بشكل مباشر في ملئها وعرض الموارد وتصنيف الموقع إلى فئة أو أخرى. تنقسم أدلة الويب عادةً إلى أدلة عالمية وموضوعية. تحاول المواضيع العالمية تغطية أكبر عدد ممكن من المواضيع. يمكنك أن تجد أي شيء هناك: من مواقع الشعر إلى موارد الكمبيوتر. بمعنى آخر، نطاق البحث الخاص بهم هو الحد الأقصى. تتخصص الأدلة المواضيعية في موضوع محدد، مما يوفر أقصى عمق للبحث عن طريق تقليل اتساع تغطية الموارد.

مزايا الكتالوجات نسبيا جودة عاليةالموارد، حيث يتم عرض كل موقع فيه واختياره من قبل شخص ما. يتيح لك التجميع المواضيعي للمواقع ترتيب المواقع ذات المواضيع المتشابهة بسهولة. يعد وضع التشغيل هذا مفيدًا لاكتشاف المواقع الجديدة بالنسبة لك في موضوع يثير اهتمامك - وهو أكثر دقة من استخدام محرك البحث. يوصى باستخدام كتالوجات الويب للتعارف الأول مع أي مجال موضوعي، بالإضافة إلى البحث عن استفسارات غامضة - ستتاح لك الفرصة "للتجول" عبر أقسام الكتالوج وتحديد ما تحتاجه بدقة أكبر.

عيوب أدلة الويب معروفة. بادئ ذي بدء، يعد هذا تجديدا بطيئا لقاعدة البيانات، لأن إدراج الموقع في الكتالوج يتطلب مشاركة بشرية. من حيث الكفاءة، دليل الويب ليس منافسًا لمحركات البحث. بالإضافة إلى ذلك، تعد أدلة الويب أدنى بكثير من محركات البحث من حيث حجم قاعدة البيانات.

عند الحديث عن البحث على الإنترنت، لا يمكننا أن نتجاهل عدداً من المصطلحات التي ترتبط ارتباطاً وثيقاً بهذا المجال، والتي غالباً ما تستخدم لوصف وتقييم محركات البحث. على سبيل المثال:اتساع وعمق البحث على الانترنت. البحث الواسع هو الذي يجمع أكبر عدد ممكن من مصادر المعلومات. في هذه الحالة، يعتبر ذكر موقع أو آخر مناسب للطلب كافيًا على الأقل. يشير عمق البحث إلى تفاصيل الفهرسة والبحث اللاحق لكل مورد محدد. على سبيل المثال، تتعامل العديد من محركات البحث مع فهرسة المواقع المختلفة بشكل مختلف. تتم فهرسة المواقع الكبيرة والشائعة إلى أقصى حد؛ وتحاول الروبوتات ألا تفوت أي صفحة من هذا المورد. وفي الوقت نفسه، في المواقع الأخرى، قد تتم فهرسة صفحة العنوان فقط وصفحتين من صفحات المحتوى. تؤثر هذه الظروف بشكل طبيعي على عمليات البحث اللاحقة. يعمل البحث العميق على مبدأ “من الأفضل تضمين معلومات غير ضرورية في النتائج بدلاً من تفويت أي بيانات ذات صلة بموضوع البحث”.

في كثير من الأحيان يمكنك العثور على مفاهيم مثلالعالمية والمحلية البحث على الانترنت. تأخذ عمليات البحث المحلية على الإنترنت في الاعتبار الموقع الجغرافي للمستخدم وتعطي الأفضلية للنتائج المرتبطة بطريقة أو بأخرى ببلد أو منطقة معينة. أثناء البحث الشامل، لا يتم أخذ هذه المعلومات في الاعتبار، ويتم البحث في جميع الموارد المتاحة.

عند إنشاء استعلام على محركات البحث على الإنترنت، تعمل أوضاع البحث المختلفة. تتضمن أوضاع البحث النموذجية الموجودة في معظم أجهزة الإنترنت ما يلي:بسيطة ومتقدمة يبحث. يتيح لك البحث البسيط تحديد ميزة بحث واحدة فقط في طلب واحد. يتيح البحث المتقدم إمكانية إنشاء استعلام من عدة شروط، وربطها بعوامل تشغيل منطقية.

لتحسين استعلامات البحث، المختلفةالمرشحات . عوامل التصفية هي تلك أو غيرها من الوسائل المساعدة لإنشاء استعلام لا يتعلق بجانب المحتوى في شروط الاستعلام، ولكنها تحدد نتائج البحث ببعض الميزات الرسمية. لذلك، على سبيل المثال، عند استخدام مرشح نوع الملف عند البحث، لا يقوم المستخدم بتزويد النظام بالمعلومات المتعلقة بموضوع طلبه، ولكنه يقتصر ببساطة على النتائج التي تم الحصول عليها على نوع ملف معين محدد في حالة طلبه.

بالنسبة لمعظم المستخدمين، تعد محركات البحث العالمية هي الوسيلة الرئيسية، وغالبًا ما تكون الوسيلة الوحيدة للبحث على الإنترنت. فهي توفر تغطية جيدة للمصادر، بالإضافة إلى مجموعة من الأدوات الكافية لحل مشكلات البحث الأساسية.

سوق محركات البحث العالمية كبير جدًا. لقد حاولنا تحليل أشهر محركات البحث، وعرضنا النتائج في الجدول رقم 1.

عند اختيار محرك بحث عالمي، تلعب جودة الموارد الموجودة بمساعدته دورًا مهمًا. يمكنك تحديد محرك البحث المفضل لمهام محددة باستخدام "طريقة التحديد". جوهرها هو أنه يتم أولاً تجميع استعلام بحث موضوعي معين، وبعد ذلك يتم مسح مجموعة من الأشخاص - خبراء في هذا المجال - لتحديد أفضل موارد الإنترنت، في رأيهم، حول الموضوع المختار. بناءً على بيانات المسح، يتم إنشاء قائمة بمواقع العلامات التي نضمن أنها ذات صلة بالطلب وتحتوي على معلومات عالية الجودة. ثم يتم إرسال الطلب إلى محركات البحث التي تم اختبارها. منطق التقييم بسيط: كلما كانت مواقع العلامات أعلى في نتائج البحث، كلما كان مورد معين مناسبًا للبحث عن معلومات حول موضوع الاختبار.


في بعض الأحيان يكون العثور على المعلومات الضرورية وذات الصلة على الإنترنت أمرًا صعبًا للغاية. يتزايد حجم البيانات المهملة على الإنترنت مثل كرة الثلج، وفي بعض الأحيان يكون من المستحيل ببساطة الوصول إلى البيانات التي تحتاجها حقًا باستخدام Yandex وGoogle التقليديين. الكتاب الذي تحمله بين يديك سيزيد من كفاءة بحثك عن المعلومات على الإنترنت عدة مرات. ويصف التقنيات ومواقع البحث والبرامج لاسترجاع المعلومات المتخصصة. تعتبر الأنواع الحديثة للبحث على الإنترنت: البحث الشامل، البحث العمودي، أنظمة البحث الوصفي، بناء محركات البحث الشخصية، البحث عن المحتوى السمعي البصري، البحث عن طريق الإنترنت الخفي. بالنسبة لجميع الأنظمة التي تم أخذها بعين الاعتبار، يتم تقديم خصائصها ونصائح لاستخدامها بأقصى قدر من الفعالية.

مقدمة

يعد البحث على الإنترنت عنصرًا مهمًا في العمل على الإنترنت. من غير المرجح أن يعرف أي شخص على وجه اليقين العدد الدقيق لموارد الويب على الإنترنت الحديثة. وعلى أية حال فإن العدد بالمليارات. لكي تتمكن من استخدام المعلومات المطلوبة في لحظة معينة، بغض النظر عن أغراض العمل أو الترفيه، تحتاج أولاً إلى العثور عليها في محيط الموارد المتجدد باستمرار. هذه ليست مهمة سهلة على الإطلاق، لأن المعلومات الموجودة على الإنترنت الحديثة ليست منظمة، مما يخلق مشاكل في العثور عليها. وليس من قبيل الصدفة أن تكون هناك "نوافذ" غريبة في هذا مساحة المعلوماتأصبحت محركات البحث على الإنترنت

من غير المرجح أن يكون هناك أشخاص من بين مستخدمي الإنترنت لم يستخدموا أبدًا محركات بحث عالمية كبيرة. أسماء Google وYandex واثنين من الأجهزة الكبيرة الأخرى أصبحت على شفاه الجميع. إنهم يتعاملون بشكل جيد مع مهام البحث اليومية على الإنترنت، وفي كثير من الأحيان لا يحاول المستخدمون حتى البحث عن بديل. وفي الوقت نفسه، يصل عدد محركات البحث على الإنترنت في عصرنا إلى الآلاف. أسباب هذا التنوع سيارات بديلةلها جذور مختلفة. تحاول بعض المشاريع التنافس بشكل مباشر مع الشركات الرائدة في السوق العالمية من خلال العمل الدقيق مع موارد الإنترنت الوطنية. ويقدم البعض الآخر إمكانات استعلام غير متوفرة من محركات البحث المعروفة. يتخصص عدد كبير من المحركات البديلة في البحث عن مجال موضوع معين أو نوع معين من المحتوى، مما يحقق نتائج مبهرة في حل هذه المشكلات. مهما كان الأمر، فإن إدراج محركات البحث هذه في ترسانة أدوات البحث على الإنترنت الخاصة بالمستخدم يمكن أن يحسن جودتها بشكل كبير. ومع ذلك، هناك فارق بسيط هنا: تحتاج إلى معرفة هذه الآلات وتكون قادرا على استخدام قدراتها.

نحن نفترض أن قراء هذا الكتاب على دراية تامة بتقنيات البحث باستخدام محركات البحث العالمية. لقد كان جيدًا جدًا لدرجة أنهم شعروا بالقيود المرتبطة باستخدامهم. على الأرجح، حاول هؤلاء الأشخاص بالفعل البحث عن أدوات إضافية معينة واستخدامها. الكلمة المطبوعة لا تتجاهل موضوع البحث على الإنترنت: تظهر المقالات بشكل دوري ويتم نشر الكتب. لكن أبطالهم، كقاعدة عامة، هم نفس الشيء - العديد من محركات البحث العالمية الرائدة. ما يجعل هذا الكتاب مختلفًا هو أنه يحاول تغطية النطاق الكامل لحلول البحث الحديثة. ستجد هنا أوصافًا وتوصيات لاستخدام أفضل الخدمات الحديثة التي تهدف إلى حل مشكلات البحث الأكثر شيوعًا. هذا الكتاب مخصص للأشخاص الذين يعملون كثيرًا على الإنترنت ويستخدمون الشبكة للعثور على المعلومات التي يحتاجون إليها - سواء كانت أعمالًا أو دراسة أو هواية.

لكي يكون البحث على الإنترنت ناجحا، يجب استيفاء شرطين: يجب صياغة الاستفسارات بشكل جيد ويجب طرحها في الأماكن المناسبة. بمعنى آخر، يتعين على المستخدم، من ناحية، أن يكون قادرًا على ترجمة اهتماماته البحثية إلى لغة استعلام البحث، ومن ناحية أخرى، معرفة جيدة بمحركات البحث وأدوات البحث المتاحة ومزاياها ومزاياها. عيوبه، والتي ستسمح له باختيار أدوات البحث الأنسب في كل حالة على حدة.

في الوقت الحالي، لا يوجد مصدر واحد يلبي جميع متطلبات البحث على الإنترنت. ولذلك، إذا كنت تأخذ بحثك على محمل الجد، فسيتعين عليك حتماً استخدام أدوات مختلفة، وذلك باستخدام كل منها في الحالة الأنسب.

الفصل 1

محركات البحث العالمية على الإنترنت

تعد محركات البحث العالمية على الإنترنت هي الوسيلة الرئيسية والأكثر شهرة للبحث على الإنترنت. توفر محركات البحث هذه أقصى قدر من التغطية للموارد المختلفة. تنتمي محركات البحث الأكبر والأكثر شهرة إلى النوع العالمي. هذه حلول قوية حقًا كمية كبيرةالميزات والأدوات التي غالبًا ما لا يعرفها العديد من المستخدمين. يتيح لك فهم ميزات وقدرات البحث الشامل التعرف على نقاط القوة والضعف في هذه الأنظمة واختيار أدوات البحث الأكثر فعالية بوعي.

سوق محركات البحث العالمية كبير جدًا. في هذا الفصل، سننظر فقط في أقوى الآلات التي يمكنها العمل بشكل مناسب مع الاستعلامات باللغة الروسية. يبدأ الفصل بقصص عن رواد البحث الروسي - نظامي Google.ru وYandex. تمت كتابة كتب والعديد من المقالات حول كل محرك من محركات البحث هذه. سنركز على الميزات الرئيسية التي تهم المستخدم النهائي ونحاول أيضًا تحديد نقاط القوة لديه.

وهي مصحوبة بتطوير بحث جديد من Microsoft - نظام Bing، الذي تم إهماله بشكل ملحوظ حتى الآن، بالإضافة إلى محرك البحث المفيد والقوي للغاية Exalead، وميزته هي الدعم الجيد للبحث في موارد الإنترنت الأوروبية. هذا النظام- لا يزال ضيفًا نادرًا في ترسانة البحث الخاصة بمستخدمينا، لذلك يتم تناوله بمزيد من التفصيل مقارنة بالآخرين.

في هذا الفصل عند المراجعة أنظمة جوجلوYandex، سنركز فقط على إمكانيات البحث على الويب، وسيتم مناقشة البحث في قواعد البيانات المتخصصة لهذه المشاريع في الفصول التالية حول البحث عن الصور والفيديو. بالنسبة لمحركات البحث العالمية الأخرى، يتم توفير المعلومات حول بحث الوسائط المتعددة فور تقديمها لها.

نظرًا لأن ثلاثة من الأبطال الأربعة في هذا الفصل هم من أصل أجنبي، نلاحظ على الفور أننا نقوم بتحليل إمكانيات نسخهم الروسية فقط. والحقيقة هي أن بعض وظائف الأنظمة الأجنبية، وخاصة التجريبية منها، غالبا ما تكون متاحة فقط في الإصدارات الأصلية من الخدمات، وعادة ما تكون باللغة الإنجليزية.

جوجل

يعتبر محرك بحث Google بجدارة الرائد العالمي في البحث الحديث على الإنترنت. تأسست شركة Google عام 1998، ولا تزال إحدى الشركات الرائدة في مجال البحث على الإنترنت وخدمات الويب.

لقد تميز مطورو Google دائمًا باهتمامهم المتزايد بتحسين خوارزميات محرك البحث الخاص بهم، فضلاً عن المحافظة المعقولة في مجال واجهة المستخدم. يمكن تسمية إمكانيات إنشاء استعلام على Google بأنها كلاسيكية، كما أصبحت طرق عرض نتائج البحث نوعًا من المعايير. في الآونة الأخيرة، قام مطورو Google بإجراء تغييرات خطيرة في هذه المجالات - بدأ أكبر محرك بحث يبدو قديمًا جدًا مقارنة بمنافسيه الشباب.

تمتلك Google واحدة من أكبر قواعد بيانات الفهرس في العالم، والتي توفر نطاقًا واسعًا من مصادر المعلومات. يتم دمج معلومات فهرس Google في عدة قواعد بيانات رأسية. بالإضافة إلى قاعدة بيانات "الويب" الأشهر، هناك عدة قواعد بيانات متعددة الوسائط ("صور"، "فيديو") تعمل مع المصادر معلومات جديده اولا بأولوالرسائل على خلاصات RSS، وقاعدة بيانات “الأخبار”، بالإضافة إلى قاعدة بيانات “المدونات” التي تقوم بفهرسة اليوميات عبر الإنترنت. بالإضافة إلى ذلك، تقدم Google مجموعة واسعة من الموارد الإضافية، من بينها خدمة رسم الخرائط ودليل مواقع الويب وخدمة الأسئلة والأجوبة. يمكن أيضًا اعتبار هذه الموارد بمثابة أدوات بحث.

في قاعدة بيانات "الويب" للتجميع استعلام جوجليقدم أوضاع بحث بسيطة ومتقدمة. في الوضع بحث بسيطمن بين الأدوات الإضافية، تتوفر لوحة المفاتيح الافتراضية فقط. يوفر البحث المتقدم المزيد من الخيارات. نظرًا لأن نموذج البحث المتقدم متوفر في جميع منتجات بحث Google تقريبًا، فلنلق نظرة عليه بمزيد من التفصيل (الشكل 1.1).

ياندكس

تم تقديم محرك بحث Yandex رسميًا لعامة الناس في عام 1997، وتم تطويره بنجاح وبعد عشر سنوات أصبح لأول مرة واحدًا من أكبر عشرة محركات بحث في العالم. وفي القطاع الروسي من الإنترنت، حقق مكانة رائدة، لا ينوي التنازل عنها بعد، على الرغم من المنافسة المتزايدة. كانت السمات المميزة لـ Yandex منذ بداية وجودها هي الخوارزميات الأصلية الخاصة بها لتحديد مدى أهمية نتائج البحث، والأدوات المرنة للعمل مع نص الاستعلام، ومراعاة خصوصيات مورفولوجيا اللغة الروسية عند معالجتها.

تعتمد Yandex على قواعد بيانات الفهرس الخاصة بها. بالإضافة إلى البحث في مستندات الويب، يقدم النظام مجموعة جيدة من الموارد المتخصصة والخدمات الإضافية. تعمل Yandex حاليًا مع الصور ومقاطع الفيديو والأخبار والمدونات والقواميس. يتم أيضًا تضمين إمكانات البحث القوية في خدمة الخرائط الخاصة بنا ونظام البحث عن المنتجات. بالإضافة إلى ذلك، تحتفظ Yandex بدليل موقع الويب الخاص بها. قوة Yandex هو برنامج بحث محلي مطور، وهو أمر مهم بشكل خاص لمستخدمينا. يوفر Yandex لمطوري الطرف الثالث إمكانية الوصول إلى قواعد البيانات الخاصة به. ونتيجة لذلك، تستخدم العديد من مشاريع البحث البديلة على الإنترنت الروسية موارد ياندكس بطريقة أو بأخرى. بالإضافة إلى نظام البحث العادي، يتم أيضًا تقديم نسخة مختصرة من Yandex، وهي متاحة على ya.ru. تتكون واجهة هذا الإصدار فقط من حقل إدخال استعلام وزر بحث.

يوفر البحث في مستندات الويب أوضاع بحث بسيطة ومتقدمة. لا يوفر البحث البسيط أي مرشحات، والتي يتم تعويضها بالقدرة على تحليل الاستعلامات تلقائيًا باللغة الطبيعية، والمعالجة الواثقة نسبيًا استعلامات طويلةبالإضافة إلى نظام استكمال الاستعلام التلقائي. الحد الأقصى لطول الطلب هو أربعون كلمة.

يقدم نموذج البحث المتقدم حقلاً واحدًا فقط لتقديم الطلب. يُقترح إدخال العوامل المنطقية التي تربط كلمات الاستعلام يدويًا، لحسن الحظ. لدى Yandex لغة استعلام مفصلة إلى حد ما. الأدوات المتبقية من نموذج البحث المتقدم هي المرشحات المتنوعة (1.4).

بنج

لا يمكن وصف تاريخ البحث على الإنترنت من Microsoft بالبساطة. لقد تغيرت الخوارزميات وقواعد البيانات المستخدمة وبالطبع الأسماء بشكل متكرر في الخدمات المقدمة باستمرار للجمهور. حتى أوائل العقد الأول من القرن الحادي والعشرين، لم يكن لدى محرك البحث قواعد بيانات خاصة به وكان يعمل مع فهارس خارجية من AltaVista وInktomi وLooksmart. تم استخدام الاسم الأصلي لـ MSN Search حتى عام 2006، ومن ثم أصبح تغيير أسماء محركات البحث تقليدًا لشركة Microsoft لعدة سنوات.

إلى جانب الانتقال النهائي إلى البحث في الفهارس الخاصة به، تمت إعادة تسمية MSN Search لأول مرة إلى Windows LiveLive Search. وأخيرا، في أوائل صيف عام 2009، تم استبدال Live Search بمشروع بحث جديد، Bing.

"سيسمح لك Bing بإلقاء نظرة مختلفة على البحث عن المعلومات على الإنترنت ومساعدة المستخدمين على اتخاذ قرارات مهمة"، كانت بداية البيان الصحفي لشركة Microsoft حول إطلاق Bing. كانت تطلعات المطورين واضحة: محركات البحث من ميكروسوفت، على الرغم من كل الجهود التي بذلتها، في الغرب كانت أقل شعبية باستمرار من القادة - جوجل وياهو!. إذا تحدثنا عن الإصدارات باللغة الروسية من مشاريع بحث Microsoft السابقة، فمن حيث كمية ونوعية الروابط، وجدت أنها أدنى بكثير من محركات البحث الروسية الكبيرة. وفي محاولة للحاق بالمنافسين، اعتمد مطورو Bing على تحسين جودة البحث وإدخال تقنيات جديدة، تم الحصول على العديد منها جنبًا إلى جنب مع الشركات التي أنشأتها.

تجدر الإشارة إلى أن إصدار Bing باللغة الروسية، مثل معظم الإصدارات المترجمة الأخرى، يفتقر إلى عدد من الوظائف الإضافية، مثل البحث في التسوق. لأنهم في الواقع يعملون فقط في الشمال. أمريكا، لا داعي للخوض فيها بالتفصيل.

إكساليد

واحدة من ميزات أوروبا، بما في ذلك في مجال البحث على الإنترنت، هي عدد كبير مناللغات الوطنية. يجب على محرك البحث الذي يدعي أنه الرائد في أوروبا أن يقوم ببساطة بفهرسة القطاعات الوطنية من الإنترنت بشكل جيد ويعالج الاستعلامات بكفاءة بالعديد من اللغات الأوروبية - الأكبر والأقل شيوعًا. وفي هذا المجال يمكن للتنمية الأوروبية أن تكتسب ميزة تنافسية جدية على المنافسين الأجانب الأقوياء. يتنافس نظام Exalead حاليًا بجدية على دور محرك البحث الأوروبي هذا. هذا المشروعتم تطويره في إطار برنامج أبحاث Quaere الممول من الاتحاد الأوروبي.

لدى Exalead قواعد بيانات الفهرس الخاصة بها. موارد البحث الرئيسية للنظام هي قواعد بيانات مستندات الويب والصور ومقاطع الفيديو والأخبار. أبدأ الصفحةتقدم Exalead خيارات التخصيص. في هذه الصفحة، يمكنك وضع روابط لمواقعك المفضلة - وسيتم عرضها في شكل لقطات شاشة رسومية مصغرة. ومع ذلك، للقيام بذلك، سيتعين عليك تسجيل حساب مجانًا، وكذلك السماح لمتصفحك بتخزين ملفات تعريف الارتباط الخاصة بـ Exalead.

يوفر Exalead Web Search أوضاع بحث بسيطة ومتقدمة. يتم فتح نموذج البحث المتقدم، كما هو الحال في Bing، مباشرةً على صفحة نتائج البحث. لاحظ أن Exalead لا يقدم نموذجًا مألوفًا يحتوي على مجموعة من الحقول الإضافية فحسب، بل يقدم أيضًا قائمة منسدلة معقدة تلعب دور المعالج لتحسين البحث. الاستعلام (الشكل 1.7). عند تحديد عنصر أو آخر في قائمة المعالج، تتم إضافة عناصر جديدة إلى سلسلة الاستعلام، وإذا لزم الأمر، عوامل التشغيل والأحرف الخاصة.

أليكسي كوتوفينكو

بحث احترافي على الإنترنت

مقدمة

يعد البحث على الإنترنت عنصرًا مهمًا في العمل على الإنترنت. لا يكاد أي شخص يعرف على وجه اليقين العدد الدقيق لموارد الويب على الإنترنت الحديثة. وعلى أية حال فإن العدد بالمليارات. لكي تكون قادرًا على استخدام المعلومات المطلوبة في لحظة معينة، بغض النظر عن أغراض العمل أو الترفيه، تحتاج أولاً إلى العثور عليها في محيط الموارد المتجدد باستمرار. هذه ليست مهمة سهلة على الإطلاق، لأن المعلومات الموجودة على الإنترنت الحديثة ليست منظمة، مما يخلق مشاكل في العثور عليها. وليس من قبيل الصدفة أن تصبح محركات البحث على الإنترنت بمثابة "نوافذ" فريدة في مساحة المعلومات هذه.

من غير المرجح أن يكون هناك أشخاص من بين مستخدمي الإنترنت لم يستخدموا أبدًا محركات بحث عالمية كبيرة. أسماء Google وYandex واثنين من الأجهزة الكبيرة الأخرى أصبحت على شفاه الجميع. إنهم يتعاملون بشكل جيد مع مهام البحث اليومية على الإنترنت، وفي كثير من الأحيان لا يحاول المستخدمون حتى البحث عن بديل. وفي الوقت نفسه، يصل عدد محركات البحث على الإنترنت في عصرنا إلى الآلاف. أسباب هذا التنوع في الآلات البديلة لها جذور مختلفة. تحاول بعض المشاريع التنافس بشكل مباشر مع الشركات الرائدة في السوق العالمية من خلال العمل الدقيق مع موارد الإنترنت الوطنية. ويقدم البعض الآخر إمكانات استعلام غير متوفرة من محركات البحث المعروفة. يتخصص عدد كبير من المحركات البديلة في البحث عن مجال موضوع معين أو نوع معين من المحتوى، مما يحقق نتائج مبهرة في حل هذه المشكلات. مهما كان الأمر، فإن إدراج محركات البحث هذه في ترسانة أدوات البحث على الإنترنت الخاصة بالمستخدم يمكن أن يحسن جودتها بشكل كبير. ومع ذلك، هناك فارق بسيط هنا: تحتاج إلى معرفة هذه الآلات وتكون قادرا على استخدام قدراتها.

نحن نفترض أن قراء هذا الكتاب على دراية تامة بتقنيات البحث باستخدام محركات البحث العالمية. لقد كان جيدًا جدًا لدرجة أنهم شعروا بالقيود المرتبطة باستخدامهم. على الأرجح، حاول هؤلاء الأشخاص بالفعل البحث عن أدوات إضافية معينة واستخدامها. الكلمة المطبوعة لا تتجاهل موضوع البحث على الإنترنت: تظهر المقالات بشكل دوري ويتم نشر الكتب. لكن أبطالهم، كقاعدة عامة، هم نفس الشيء - العديد من محركات البحث العالمية الرائدة. ما يجعل هذا الكتاب مختلفًا هو أنه يحاول تغطية النطاق الكامل لحلول البحث الحديثة. ستجد هنا أوصافًا وتوصيات لاستخدام أفضل الخدمات الحديثة التي تهدف إلى حل مشكلات البحث الأكثر شيوعًا. هذا الكتاب مخصص للأشخاص الذين يعملون كثيرًا على الإنترنت ويستخدمون الشبكة للعثور على المعلومات التي يحتاجون إليها - سواء كانت أعمالًا أو دراسة أو هواية.

لكي يكون البحث على الإنترنت ناجحا، يجب استيفاء شرطين: يجب صياغة الاستفسارات بشكل جيد ويجب طرحها في الأماكن المناسبة. بمعنى آخر، يتعين على المستخدم، من ناحية، أن يكون قادرًا على ترجمة اهتماماته البحثية إلى لغة استعلام البحث، ومن ناحية أخرى، معرفة جيدة بمحركات البحث وأدوات البحث المتاحة ومزاياها ومزاياها. عيوبه، والتي ستسمح له باختيار أدوات البحث الأنسب في كل حالة على حدة.

في الوقت الحالي، لا يوجد مصدر واحد يلبي جميع متطلبات البحث على الإنترنت. ولذلك، إذا كنت تأخذ بحثك على محمل الجد، فسيتعين عليك حتماً استخدام أدوات مختلفة، وذلك باستخدام كل منها في الحالة الأنسب.

هناك العديد من أدوات البحث المتاحة. ويمكن دمجها في عدة مجموعات، ولكل منها مزايا وعيوب معينة. فصول كتابنا مخصصة للمجموعات الرئيسية لمحركات البحث على الإنترنت الحديثة.

الفصل الأول بعنوان "محركات البحث العالمية على الإنترنت" مخصص للأنظمة العالمية الكبيرة لاسترجاع المعلومات على الويب. ينصب التركيز الرئيسي على أدواتهم الأكثر تقدمًا، والتي تقع عادةً تحت رادار عامة الناس. إن مراجعة قدرات الأجهزة المعروفة تعطينا نوعًا من نقطة البداية وتسمح لنا بتخيل نطاق تطبيق حلول البحث البديلة بوضوح.

يتحدث الفصل الثاني، "البحث العمودي"، عن الأنظمة المتخصصة في مجالات مواضيعية محددة أو أنواع محددة من المحتوى.

ويتناول الفصل الثالث، "Metasearch"، محركات البحث الوصفية التي يمكنها إرسال استعلام في وقت واحد إلى عدة محركات بحث على الإنترنت، ثم جمع النتائج ومعالجتها في واجهة واحدة.

الفصل الرابع، "محركات البحث الدلالية والمرئية على الإنترنت"، هو نظرة عامة على الأنظمة التجريبية التي تقدم منتجات أصلية واجهات المستخدم، بالإضافة إلى الأساليب المثيرة للاهتمام لمعالجة الاستعلامات.

يعرض الفصل الخامس، "آلات التوصية"، ما ظهر مؤخرًا خدمات البحث، في اللغة الإنجليزية يُطلق عليها اسم "Discovery Engines"، أي "آلات الاكتشاف". وبمساعدتهم، يمكنك معالجة عدد من الاستعلامات الصعبة للغاية بالنسبة للأنواع الأخرى من محركات البحث على الإنترنت.

إذا لم يكن هناك منتج جاهز يناسبك، فيمكنك إنشاء محرك بحث خاص بك على الإنترنت. الفصل السادس، "محركات البحث الشخصية"، مخصص لإنشاء مثل هذه الآلات الشخصية.

تم تخصيص عدة فصول من كتابنا للبحث عن الأنواع المختلفة محتوى الشبكة. يقدم الفصل السابع، "استرجاع الصور"، الاتجاهات الحالية في استرجاع الصور عبر الإنترنت بالإضافة إلى قدرات الأنظمة التجريبية ذات الصلة. ويقدم الفصل الثامن بعنوان “البحث عن الفيديو” نظرة عامة على أدوات البحث عن الفيديو الخاصة بمحركات البحث العالمية الرائدة على الإنترنت، بالإضافة إلى أفضل الأنظمة المتخصصة في هذا المجال.

الفصل التاسع، "العثور على المحتوى "المخفي"، هو نظرة عامة على الأنظمة التي تسمح لك بالبحث عن المحتوى "الذي لا تراه" محركات البحث العالمية. يتضمن هذا المحتوى "المخفي"، على سبيل المثال، ملفات التورنت أو الملفات المستضافة على خوادم FTP ومواقع استضافة الملفات.

يقدم الفصل العاشر، "البحث عن الويب 3.0"، أدوات البحث على الإنترنت عن البيانات بتنسيقات الويب الدلالية.

لا ينتهي البحث بمجرد تلقي النتائج من محرك بحث معين. الفصل الأخير من كتابنا، الفصل 11، "البرامج المساعدة"، مخصص لأدوات معالجة النتائج وحفظها.

قبل البدء بقصة عن منتجات محددة، فمن المنطقي أن نفهم التصنيف الوسائل الحديثةالبحث في الإنترنت، وكذلك تحديد المصطلحات التي تظهر باستمرار على صفحات كتابنا.

يمكن تقسيم أدوات البحث الرئيسية على الإنترنت إلى المجموعات الرئيسية التالية:

محركات البحث؛

أدلة الويب؛

موارد المساعدة؛

البرامج المحلية للبحث في الإنترنت.

أدوات البحث الأكثر شيوعًا هي محركات البحث - ما يسمى بمحركات البحث على الإنترنت (محركات البحث). إن القادة الثلاثة الأوائل على المستوى العالمي مستقرون تمامًا - جوجل وياهو! وبنج. في العديد من البلدان، تتم إضافة محركات البحث المحلية الخاصة بها، المحسنة للعمل مع المحتوى المحلي، إلى هذه القائمة. بمساعدتهم، يمكنك نظريًا العثور على أي كلمة محددة على صفحات ملايين المواقع.

على الرغم من الاختلافات العديدة، تعمل جميع محركات البحث على الإنترنت وفقًا لمبادئ مماثلة، ومن الناحية الفنية، تتكون من أنظمة فرعية مماثلة.

الجزء الهيكلي الأول لمحرك البحث هو البرامج الخاصة المستخدمة للبحث التلقائي والفهرسة اللاحقة لصفحات الويب. تسمى هذه البرامج عادةً بالعناكب أو الروبوتات. إنهم ينظرون إلى كود صفحات الويب، ويجدون الروابط الموجودة عليها، وبالتالي يكتشفون صفحات ويب جديدة. هناك طريقة بديلة لتضمين موقع في الفهرس. توفر العديد من محركات البحث لأصحاب الموارد الفرصة لإضافة موقع إلى قاعدة بياناتهم بشكل مستقل. ومع ذلك، يتم بعد ذلك تنزيل صفحات الويب وتحليلها وفهرستها. فهي تسلط الضوء على العناصر الهيكلية، وتبحث عن الكلمات الرئيسية، وتحدد ارتباطاتها بالمواقع وصفحات الويب الأخرى. يتم أيضًا تنفيذ عمليات أخرى تكون نتيجتها تكوين قاعدة بيانات فهرس محرك البحث. قاعدة البيانات هذه هي العنصر الرئيسي الثاني لأي محرك بحث. في الوقت الحالي، لا توجد قاعدة بيانات فهرس واحدة كاملة تمامًا تحتوي على معلومات حول جميع محتويات الإنترنت. نظرًا لأن محركات البحث المختلفة تستخدم برامج بحث مختلفة لصفحات الويب وتقوم ببناء فهرسها باستخدام خوارزميات مختلفة، فقد تختلف قواعد بيانات فهرس محركات البحث بشكل كبير. تتم فهرسة بعض المواقع بواسطة العديد من محركات البحث، ولكن هناك دائمًا نسبة معينة من الموارد المضمنة في قاعدة بيانات محرك بحث واحد فقط. إن وجود مثل هذا الجزء الأصلي وغير المتداخل من الفهرس في كل محرك بحث يسمح لنا باستخلاص نتيجة عملية مهمة: إذا كنت تستخدم محرك بحث واحدًا فقط، حتى لو كان المحرك الأكبر، فسوف تفقد بالتأكيد نسبة معينة من الروابط المفيدة. .