Fulltextové vyhledávání: Porovnání verzí

Z enTeam
Skočit na navigaci Skočit na vyhledávání
(Databázový účet pro potřeby fulltextového vyhledávání)
Řádek 11: Řádek 11:
  
 
==Databázový účet pro potřeby fulltextového vyhledávání==
 
==Databázový účet pro potřeby fulltextového vyhledávání==
Fulltextové vyhledávání je vždy prováděno pod účtem "teambridge". Heslo uživatele je nutné zadat stejné, jako je použito pro hlavní databázi enTeam Workflow manager.
+
Fulltextové vyhledávání je vždy prováděno pod účtem "teambridge". Heslo uživatele je nutné zadat stejné, jako je použito pro hlavní databázi enTeam Workflow Manager.
 
 
  
 
==Úprava konfiguračního souboru parent.ini==
 
==Úprava konfiguračního souboru parent.ini==

Verze z 6. 1. 2021, 00:08

Fulltextové vyhledávání je připraveno tak, že se v naplánovaných intervalech pomocí "Windows scheduleru" volá nástroj "MFullTextIndex.exe", který provádí indexaci naposledy změněných procesů. Vyhledávání je možné buď pomocí ikony červené lupy, nebo Shift + Ctrl + F.

Příprava databázového serveru

Pro fulltextové vyhledávání se vždy využívá MS SQL server, a to bez ohledu na to, zda je enTeam Workflow manager nainstalován na databázovém serveru Firebird, MS SQL, nebo na Oracle.
a) Pokud je enTeam Workflow manager nainstalován na MSSQL serveru s podporou fulltextového vyhledávání, pak je vhodné využít tento SQL server.
b) V případě instalace enTeam na jiném typu databáze (Oracle, Firebird), případně na MSSQL serveru bez podpory fulltextového vyhledávání, je možné zdarma využít MS SQL Server Express.

Informaci, zda je ve stávající instalaci SQL serveru podporováno fulltextové vyhledávání, lze získat dotazem:

  SELECT SERVERPROPERTY('IsFullTextInstalled')
  0 = fulltextové prohledávání není instalováno, 1 = je instalováno

Databázový účet pro potřeby fulltextového vyhledávání

Fulltextové vyhledávání je vždy prováděno pod účtem "teambridge". Heslo uživatele je nutné zadat stejné, jako je použito pro hlavní databázi enTeam Workflow Manager.

Úprava konfiguračního souboru parent.ini

  [M/FULLTEXT]
  Server=SQLserver:Database
  DocumentFilter=$DOC_TITLE='*'
  IndexAttachments=false
  IndexDoc=false
  IndexDocX=false
  MaxDocSentences=200
  IndexTif=false
  IndexPdf=false
  IndexEMail=false
  Debug=false
  MaxCaseCount=10000
  Server: server a databáze fulltextové databáze
  DocumentFilter: pomocí standardního filtru enTeam Workflow Manager lze omezit indexaci pouze na některé typy souborů
  IndexAttachments: indexovat přílohy, True/False (Ano/Ne)
  Index***: indexovat přílohu určitého typu
  MaxDocSentences: u příloh typu MS Word je nutné určit, kolik prvních vět dokumentů se bude indexovat. Z důvodu ušetření místa se indexuje pouze prvních N vět.
  IndexEMail: indexovat e-maily
  Debug: při indexování zobrazovat detailní informace
  MaxCaseCount: s ohledem na zatížení serveru je vhodné indexovat historii enTeam Workflow Manager po částech. Klíč udává maximální počet indexovaných v rámci jednoho běhu.
  

Pluginy pro vytěžování různých typů příloh

Pro podporu OCR souborů typu TIFF je nutné nainstalovat PumaNet. Pro vytěžování MS Word je nutné na indexačním serveru nainstalovat MS Word.

Test indexace

Pomocí filtru DocumentFilter=$DOC_TITLE='TEST Fulltext' nastavte, které procesy budete indexovat. Vytvořte proces s název "TEST Fulltext" a zapište do něj nějaký text. Spusťte indexování příkazem "MFullTextIndex.exe -index" Pomocí kontextového menu na ikoně "M" vyhledejte část zadaného textu.

Automatické indexování

Nastavte naplánovanou úlohu, které bude cca 1x za hodinu spouštět "MFullTextIndex.exe -index"


Známé problémy

Při indexaci volané z naplánovaných úloh se neprovádí indexace MS Word dokumentů

Vytvořte adresář "C:\Windows\SysWOW64\config\systemprofile\Desktop" (pro 64 bit Windows) nebo "C:\Windows\System32\config\systemprofile\Desktop" (pro 32 bit Windows)

Nastavte uživateli, pod nímž se spouští naplánovaná úloha, plné oprávnění pro tento adresář.

Ukazatel posledního dne indexace je i přes opakované spuštění stále nastaven na stejný den

Indexace funguje tak, že si indexační nástroj pamatuje poslední zaindexovaný den a indexuje procesy od tohoto dne do budoucna. Pokud zaindexuje celý den, pak je ukazatel posledního indexovaného dne posunut o jeden den vpřed. Pokud však nedojde k indexaci všech procesů změněných v rámci jednoho dne, pak se ukazatel neposune na další den a příští indexaci bude opět indexovat procesy ze stejného dne a k posunu ukazatele nedojde. Hodnota klíče MaxCaseCount pak musí být navýšena. Ukazatel na poslední den indexace je možné zjistit příkazem: "MFullTextIndex.exe -lastindex"