Knowledge base KB0118

Impossibile indicizzare il contenuto in Office SharePoint

Problema

Office SharePoint non riesce a eseguire completamente la scansione di un'origine di contenuto contenente file Excel con collegamenti think-cell e il seguente messaggio è presente nel registro di scansione:

Errore nel servizio Web per i dati del sito. (Carattere surrogato alto non valido (0xXXXX). Un carattere surrogato alto deve avere un valore compreso nell'intervallo (0xD800 - 0xDBFF).)

Causa

Questo problema è dovuto a un bug in Excel 2000 ed Excel XP che provoca la generazione di file Excel con metadati corrotti. Esso si verifica quando una proprietà documento definita dall'utente con stringa e un'origine collegata viene aggiunta a un documento Excel e l'origine non può essere risolta. Nelle versioni successive di Excel il valore della proprietà documento è impostato su un elemento valido (ad esempio, una stringa vuota). In Excel 2000 ed Excel XP, tuttavia, il valore contiene dati errati e può causare un errore del crawler di Office SharePoint. La documentazione Excel afferma esplicitamente che il valore della proprietà documento è impostato su un valore predefinito prima di essere aggiornato quando l'origine è risolta. Pertanto, questo comportamento è un bug di Excel 2000 ed Excel XP.

Il problema può essere riprodotto utilizzando la seguente procedura:

  1. Utilizzare il seguente link per scaricare un file Excel molto semplice: LinkSourceProp.xls.
  2. Caricare il file utilizzando Office 2000 o Office XP Excel, assicurandosi che le macro siano attivate.
  3. Premere Alt+F11 per aprire la finestra delle macro ed eseguire la routine AddDocumentProperty.
  4. Accedere a FileProprietà e selezionare la scheda Personalizzata.
  5. Il valore associato alla voce appena aggiunta TestProperty è illeggibile.
Finestra di dialogo Metadati in Excel

Soluzione

think-cell utilizza proprietà documento personalizzate. Dopo aver rilevato questo comportamento, abbiamo modificato il nostro codice per aggiungere le nostre proprietà documento con il tipo booleano anziché con il tipo stringa. Sia Excel 2000 che Excel XP impostano la proprietà documento su un valore booleano valido e questo valore rimane valido quando l'origine del collegamento non può essere risolta.

I file creati con think-cell 5.0 e superiori utilizzano questa soluzione alternativa e dovrebbero essere correttamente scansionabili da Office SharePoint.

Contattare direttamente il supporto Microsoft Office per consigli su come riparare valori di proprietà documento corrotte in file generati in Excel 2000 o Excel XP.