Knowledge-Base-Artikel (KB0118)

Das Durchforsten von Inhalten in Office SharePoint schlägt fehl.

Problem

Office SharePoint kann eine Inhaltsquelle mit Excel-Dateien, die über think-cell Links verfügen, nicht vollständig durchforsten. Im Crawlprotokoll wird die folgende Nachricht angezeigt:

Fehler im Websitedaten-Webdienst. (Ungültiges hohes Ersatzzeichen (0xXXXX). Ein hohes Ersatzzeichen muss einen Wert im Bereich (0xD800 - 0xDBFF) aufweisen.

Ursache

Das Problem wird von einem Fehler in Excel 2000 und Excel XP verursacht. Er führt dazu, dass Excel-Dateien mit beschädigten Metadaten generiert werden. Das Problem tritt auf, wenn einem Excel-Dokument eine benutzerdefinierte Dokumenteigenschaft mit Zeichenfolge und einer verknüpften Quelle hinzugefügt wird und sich die Quelle nicht auflösen lässt. In neueren Versionen von Excel weist die Dokumenteigenschaft einen gültigen Wert auf (z. B. eine leere Zeichenfolge). In Excel 2000 und Excel XP enthält der Wert jedoch Datenmüll, was dazu führen kann, dass der Crawler von Office SharePoint nicht korrekt funktioniert. In der Excel-Dokumentation wird ausdrücklich darauf verwiesen, dass beim Auflösen der Quelle der Dokumenteigenschaftswert vor dem Aktualisieren ein Standardwert zugewiesen wird. Das Verhalten wird also von einem Fehler in Excel 2000 und Excel XP verursacht.

Das Problem lässt sich mit den folgenden Schritten reproduzieren:

  1. Verwenden Sie den folgenden Link, um eine einfache Excel-Datei herunterzuladen: LinkSourceProp.xls.
  2. Laden Sie die Datei in Office 2000 oder Office XP Excel, und stellen Sie sicher, dass Makros aktiviert sind.
  3. Drücken Sie auf Alt+F11, um das Makrofenster zu öffnen, und führen Sie die Routine AddDocumentProperty aus.
  4. Klicken Sie auf DateiEigenschaften und wechseln Sie auf die Registerkarte Anpassen.
  5. Der mit dem neuen Eintrag TestProperty verknüpfte Wert ist Datenmüll.
Excel-Dialogfeld „Metadaten“

Lösung

think-cell verwendet benutzerdefinierte Dokumenteigenschaften. Nach der Ermittlung des Fehlers haben wir unseren Code so geändert, dass unsere Dokumenteigenschaften anstelle einer Zeichenfolge einen booleschen Wert aufweisen. Sowohl Excel 2000 als auch Excel XP nutzen für die Dokumenteigenschaft einen gültigen booleschen Wert. Dieser Wert bleibt auch dann gültig, wenn sich die Linkquelle nicht auflösen lässt.

Mit think-cell 5.0 und höher erstellte Dateien nutzen diesen Workaround und sollten daher bei Crawlen mit Office SharePoint keine Probleme hervorrufen.

Wenden Sie sich direkt an den Microsoft Office-Support, wenn Sie Hilfe bei der Reparatur beschädigter Dokumenteigenschaften in mit Excel 2000 oder Excel XP erstellten Dateien benötigen.