Web-Information-Retrievel Global - Regional

Physikalisch-technische Systeme bestehen aus wechselwirkenden Komponenten. Autonome Systeme können ähnlich zu bedingt "sich selbst organisierende Funktionseinheiten" gesehen werden. Die Systemtheorie versucht unterschiedliche Begriffe und Fachgebieten als "kybernetisch-strukturierte Ganzheiten" zu fassen. Es gibt globale, weltweite, top-down Betrachtungen mit Versuchen, "von oben her" die Erde als Ganzes als strategische Spielwiese für Energie, Nahrung, Finanzen, Informationen zu fassen. Es gibt bottom-up Sichtweisen, die sich mehr an menschlichen Bedürfnissen orientieren ( Haushalt, Familie, Ort, Region ) und lokales, regionales, hausintern-privates Leben "unmittelbar" fassen möchten.

Henry Ford : Zusammenkunft ist ein Anfang. Zusammenhalt ist ein Fortschritt. Zusammenarbeit ist der Erfolg.


Einführendes Um was geht es?

Das Informationszeitalter ist gekennzeichnet durch ein globales, regionales Miteinander und globale oder/und regional-begrenzte Informationsströme und Information Retrieval . Dieses Projekt dient dem Verstehen ( siehe z.B. de.wikipedia Hermeneutische_Methode ) des angesprochenen Themenkreises und soll zu einer selbst erstellten App führen, die aus dem angesprochenen Themenkreis ist und natürlich lediglich einen machbaren Umfang haben wird.

Es geht um Zusammenhänge und Informationsstrukturen im Web, das Sammeln, Aufbereiten und Strukturieren von Web-Daten mit einer zu entwickelnden App. Einige Stichworte: Informationsbeschaffung, Recherchen , Information-Retrievel , Suchwerkzeuge im Web, Webrobots, Suchroboter, Crawler, Spider, web filtering, Spam or bad bot, User-Agents, SEO , robots.txt , sitemap.xml , sitemap.htm sitemaps.org

Was sagen andere zu den modernen Massenphänomen der Web-Kommunikation?
Kurt Weidemann: Auf die Explosion der unbegrenzten Möglichkeiten folgt die Implosion ihrer Beherrschung.
Eine französische Weisheit sagt es so: Berg und Tal kommen nicht zusammen, aber die Menschen.
Wilhelm von Humboldt: Im Grunde sind es immer die Verbindungen mit Menschen, die dem Leben seinen Wert geben.

Das weltweite Information-Retrieval im Web hängt von den (unermesslichen) rechtlichen Divergenzen und Freiräumen und dem (unermesslichen) Speichervolumen der Daten-Kathedralen und den (unermesslichen) Möglichkeiten der Programmierung von Webrobots, Suchrobotern, Crawlern, Spidern, usw. ab. Die Search Engine Optimization ( SEO ) und die automatisierten Bewertungen durch andere hängen von den "Geheimnissen" der Webrobots, Suchrobotern, Crawler, Spider, usw. ab. "Kostenfreie Suchmaschinen" möchten bequem, zuverlässig und objektiv erscheinen. Im verdrängenden Wettbewerb stellen proprietäre Suchmaschinenbewertungen (auch beliebte Suchmaschinen) die Eigenprodukte stets auf die vordersten Plätze. Typische Aussage eines Suchmaschinenbetreibers: "Dies tun wir im Interesse unserer Mitarbeiter ...".

Sind weltweit dominierende Suchmaschinen ein Segen oder/und "Dampfwalzen zum Einstampfen" von regionalen Produkten?


Suchmaschinenoptimierung SEO

Wie sieht eine einfache sitemap.xml aus?

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
  xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
  xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd">
<url>
    <loc>http://www.cilie.org/</loc>
    <lastmod>2013-10-21T14:23:43+00:00</lastmod>
</url>
  <url>
    <loc>http://www.cilie.org/esa/index.htm</loc>
    <lastmod>2014-05-01T10:12:14+00:00</lastmod>
  </url>
</urlset>

Hinweise: SEO-Einfuehrung (.pdf) webmasters answer.py webmasters robots.txt Best Practices HTML-Sitemap Sitemaps-XML-Format kanonische url A spider's view of Web 2.0 AJAX + SEO proposal 2009 DMOZ-Links zu Sitemaps

PHP-Hinweise ( globale Variablen ) PHP

PHP kennt superglobale ( Array-) Variablen, die in jedem Bereich sichtbar sind. Zu diesen gehört der $GLOBALS-Array. Zum Arbeiten mit eigenen globalen Variablen bietet sich an, eine eigene globalen Array $MY_GLOBALS zu verwenden, wie z.B.

$MY_GLOBALS = array();// eigener globaler Array

function get_glob($key)           { global $MY_GLOBALS; return $MY_GLOBALS[$key];}
function set_glob($key, $val = ""){ global $MY_GLOBALS; $MY_GLOBALS[$key] = $val;}

$myGlobVar1                  = 4711; 
$MY_GLOBALS[ 'myGlobVar2' ]  = 4712;
set_glob( 'myGlobVar3',        4713);
set_glob( 'myGlobVar4',    1 + get_glob('myGlobVar3') );

$s ="<pre>testausgabe1 vom Server\nABC\näöü\nÄÖÜß\n➊➋➌<br /><br />";
$s .= "\n  get_glob( 'myGlobVar2' ) liefert  =" . get_glob('myGlobVar2');
$s .= "\n  get_glob_arr() =" . echo_arr( get_glob_arr() );
$s .= "</pre>";
echo_pre($s);
PHP-Hinweise ( GET ) PHP

PHP hat supergrlobale Arrays, wie z.B. $_GET, die bei "clientseitigen get-Aufruf" gefüllt und in $_GET an PHP übergeben werden. Beispiel:

<?php // <a href="index.php?dir=pfad&pg=seite">FAQ</a>
  $url = ''; 
  $dir = $_GET['dir']; 
  $pg  = $_GET['pg']; $pgs = array('pg1', 'pg2', 'pg3');
  if (!empty($dir)) { $url .= $dir . '/';}
  if(in_array($pg,$pgs)) { $url .= $_GET['pg'] . '.php';}
  include $url;
?>
PHP Hinweise ( Rekursivität im Dateisystem ) PHP

Achtung! FEHLERHAFTER CODE! Das zentrale Code-Stueck fuer das Durchlaufen der Verzeichnis/Datei-Hierachie des Filesytems ist while-Schleife ( siehe unten ). Bei der Deklarative Programmierung ist die Hauptkontrollstruktur ist die Rekursion. Hier Rekursive Aufrufe mit true/false-Unterscheidung: Bei einem Verzeichnis-Eintritt wird push_dateinamen($item,false), bei Dateien ( Files ) wird push_dateinamen($item,true ) aufgerufen. Wichtig ist der Rekurionsstart. Z.B. bedeutet $root_str='../../*'; dass das Start-Rekursionsverzeichnis 2 Ebene über dem aktuellen Verzeichnis ist. Wie kann die richtige Start-Ebene automatisch ermittelt werden?

Achtung! Der folgende Code ist FEHLERHAFT. Erst verstehen, dann VERBESSERN!

function push_dateinamen($item, $ist_eine_datei=true) {  
   global $loc_arr, $robots_arr, $root_str, $root_str_len, 
          $path, $ignoriere_dateien, $ignoriere_verzeichnisse;

   if($ist_eine_datei){ if(ein_arr_ele_in_item_str($ignoriere_dateien,$item)) {return;}
     $str = $item; $str = substr($item,$root_str_len); 
     $str = preg_replace('/^(.+)\/(.*?)$/','${1}/ZzyZ${2}',$str);
     array_push($loc_arr, $str);
   } else { 
     if(ein_arr_ele_in_item_str($ignoriere_verzeichnisse, $item)) { 
       $str = "Disallow: /".substr($item,$root_str_len)."/";
       array_push($robots_arr,$str); 
       return;
     }
     $str = $item.'/000o'; $str = substr($str, $root_str_len); 
     array_push($loc_arr, $str);
     $path[] = $item . '/*'; 
   } 
}

while(count($path) != 0) { $v = array_shift($path);
  foreach(glob($v) as $item) { 
    if (is_dir($item))        { push_dateinamen($item,false);
    } elseif (is_file($item)) { push_dateinamen($item,true);
    }
  }

}
Hinweise zum Vorgehen AJAX, JSON, PHP, Rekursivität

Günstig ist wohl: app10.htm und app10.php ins gleiche Verzeichnungen der MMK-Lösungen. Alle Dateien des Server-Datei-Systems können rekursiv durchlaufen werden. Hinweise in der Veranstaltung. Z.B. liefert ein Verzeichnis ( "." bzw. ".." ) den Verzeichnispfad. Die Dateinamen im Pfad liefern die Dtaeinamen und damit z.B.a.Tags. Herausgesuchte Inhalt aus jeder Datei liefern dann z.B. eine sitemap.htm oder sitemat.xml. WWW-Surfer können eine zusammen fassende Homepage-Seitenübersicht nutzen, die eine hierarchisch strukturierte Darstellung aller Einzeldokumente (Seitenstruktur der Webseiten, Sitemap) zeigt. Eine Sitemap zeigt hierarchisch strukturiert eine Darstellung aller Einzeldokumente (Seitenstruktur der Webseiten). Sitemaps sind auch ein effektives Mittel zur Suchmaschinenoptimierung ( statische Erreichbarkeit der Seiten ). Ein Anfang start.htm , start.php

Viel Freude bei der Ausarbeitung!
Letzter Abgabetermine So 12.00 Uhr