Fulltextové vyhledávání

Z enTeam
Verze z 2. 5. 2018, 08:03, kterou vytvořil en>Kadel
(rozdíl) ← Starší verze | zobrazit aktuální verzi (rozdíl) | Novější verze → (rozdíl)
Skočit na navigaci Skočit na vyhledávání

Fulltextové vyhledávání je připraveno tak, že se v naplánovaných intervalech pomocí "Windows scheduleru" volá nástroj "MFullTextIndex.exe", který provádí indexaci naposledy změněných procesů. Vyhledávání je možné buď pomocí ikony červené lupy, nebo Shift + Ctrl + F.

Příprava databázového serveru

Pro fulltextové vyhledávání se vždy využívá MS SQL server a to bez ohledu na to, zda je M/Teambridge nainstalován na databázovém serveru Firebird, MS SQL, nebo na Oracle. a) Pokud je MTB nainstalován na MSSQL serveru s podporou fulltextového vyhledávání, pak je vhodné využít tento SQL server.
b) V případě instalace MTB na jiném typu databáze (Oracle,Firebird), případně na MSSQL serveru bez podpory fulltextového vyhledávání je možné zdarma využít MS SQL server express, např:Instalovat Microsoft SQL Server 2008 R2 Express with Advanced Services.

Instalaci lze stáhnout na adrese:

  ftp://suse.kadel.cz/Tools/MS%20SQL%20server/2008advanced-32bit/
  nebo
  ftp://suse.kadel.cz/Tools/MS%20SQL%20server/2008advanced-64bit/

Informaci, zda je ve stávající instalaci SQL serveru podporováno fulltextové vyhledávání, lze získat dotazem:

  SELECT SERVERPROPERTY('IsFullTextInstalled')
  0 = fulltextové prohledávání není instalováno, 1 = je instalováno

Databázový účet pro potřeby fulltextového vyhledávání

Fulltextové vyhledávání je vždy prováděno pod účtem "teambridge". Heslo uživatele je nutné zadat stejné, jako je použito pro hlavní databázi M/TeamBridge.


Úprava konfiguračního souboru parent.ini

  [M/FULLTEXT]
  Server=SQLserver:Database
  DocumentFilter=$DOC_TITLE='*'
  IndexAttachments=false
  IndexDoc=false
  IndexDocX=false
  MaxDocSentences=200
  IndexTif=false
  IndexPdf=false
  IndexEMail=false
  Debug=false
  MaxCaseCount=10000
  Server : server a databáze fulltextové databáze
  DocumentFilter : pomocí standardního M/TB filtru lze omezit indexaci pouze na některé typy souborů
  IndexAttachments : indexovat přílohy Ano/Ne
  Index*** : indexovat přílohu určitého typu
  MaxDocSentences : u příloh typu MS Word je nutné určit, kolik prvních vět dokumentů se bude indexovat. Z důvodu ušetření místa se indexuje pouze prvních N vět.
  IndexEMail : indexovat emaily
  Debug : při indexování zobrazovat detailní informace
  MaxCaseCount : s ohledem na zatížení serveru je vhodné indexovat historii M/TB po částech. Klíč udává maximální počet indexovaných v rámci jednoho běhu.
  

Pluginy pro vytěžování různých typů příloh

Pro podporu OCR souborů typu TIFF je nutné nainstalovat PumaNet. Pro vytěžování MS Word je nutné na indexačním serveru nainstalovat MS Word.

Test indexace

Pomocí filtru DocumentFilter=$DOC_TITLE='TEST Fulltext' nastavte, které procesy budete indexovat. Vytvořte proces s název "TEST Fulltext" a zapište do něj nějaký text. Spusťte indexování příkazem "MFullTextIndex.exe -index" Pomocí kontextového menu na ikoně "M" vyhledejte část zadaného textu.

Automatické indexování

Nastavte naplánovanou úlohu, které bude cca 1x za hodinu spouštět "MFullTextIndex.exe -index"


Známé problémy

Při indexaci volané z naplánovaných úloh se neprovádí indexace MS Word dokumentů

Create directory "C:\Windows\SysWOW64\config\systemprofile\Desktop " (for 64 bit Windows) C:\Windows\System32\config\systemprofile\Desktop " (for 32 bit Windows) Set Full control permissions for directory Desktop to scheduler task user)

Ukazatel posledního dne indexace je i přes opakované spuštění stále nastaven na stejný den

Indexace funguje tak, že si indexační nástroj pamatuje poslední zaindexovaný den a indexuje procesy od tohoto dne do budoucna. Pokud zaindexuje celý den, pak je ukazatel posledního indexovaného dne posunut o jeden den v před. Pokud však nedojde k indexaci všech procesů změněných v rámci jednoho dne, pak se ukazatel neposune na další den a příští indexaci bude opět indexovat procesy ze stejného dne a k posunu ukazatele nedojde. Hodonta klíče MaxCaseCount pak musí být navýšena. Ukazatel na poslední den indexace je možné zjistit příkazem: "MFullTextIndex.exe -lastindex"