Fulltextové vyhledávání: Porovnání verzí

Z enTeam
Skočit na navigaci Skočit na vyhledávání
(Příprava databázového serveru)
 
(Není zobrazeno 5 mezilehlých verzí od stejného uživatele.)
Řádek 1: Řádek 1:
 
Fulltextové vyhledávání je připraveno tak, že se v naplánovaných intervalech pomocí "Windows scheduleru" volá nástroj "MFullTextIndex.exe", který provádí indexaci naposledy změněných procesů. Vyhledávání je možné buď pomocí ikony červené lupy, nebo Shift + Ctrl + F.
 
Fulltextové vyhledávání je připraveno tak, že se v naplánovaných intervalech pomocí "Windows scheduleru" volá nástroj "MFullTextIndex.exe", který provádí indexaci naposledy změněných procesů. Vyhledávání je možné buď pomocí ikony červené lupy, nebo Shift + Ctrl + F.
  
<h2>Příprava databázového serveru</h2>
+
==Příprava databázového serveru==
Pro fulltextové vyhledávání se vždy využívá MS SQL server, a to bez ohledu na to, zda je enTeam Workflow manager nainstalován na databázovém serveru Firebird, MS SQL, nebo na Oracle.
+
Pro fulltextové vyhledávání se vždy využívá MS SQL server, a to bez ohledu na to, zda je enTeam Workflow Manager nainstalován na databázovém serveru Firebird, MS SQL, nebo na Oracle.<br/>
a) Pokud je enTeam Workflow manager nainstalován na MSSQL serveru s podporou fulltextového vyhledávání, pak je vhodné využít tento SQL server.<br/>
+
a) Pokud je enTeam Workflow Manager nainstalován na MSSQL serveru s podporou fulltextového vyhledávání, pak je vhodné využít tento SQL server.<br/>
b) V případě instalace MTB na jiném typu databáze (Oracle, Firebird), případně na MSSQL serveru bez podpory fulltextového vyhledávání, je možné zdarma využít MS SQL Server Express, např. instalovat Microsoft SQL Server 2008 R2 Express with Advanced Services.
+
b) V případě instalace enTeam na jiném typu databáze (Oracle, Firebird), případně na MSSQL serveru bez podpory fulltextového vyhledávání, je možné zdarma využít MS SQL Server Express.  
 
 
Instalaci lze stáhnout na adrese: 
 
  ftp://suse.kadel.cz/Tools/MS%20SQL%20server/2008advanced-32bit/
 
  nebo
 
  ftp://suse.kadel.cz/Tools/MS%20SQL%20server/2008advanced-64bit/
 
  
 
Informaci, zda je ve stávající instalaci SQL serveru podporováno fulltextové vyhledávání, lze získat dotazem:
 
Informaci, zda je ve stávající instalaci SQL serveru podporováno fulltextové vyhledávání, lze získat dotazem:
Řádek 15: Řádek 10:
 
   0 = fulltextové prohledávání není instalováno, 1 = je instalováno
 
   0 = fulltextové prohledávání není instalováno, 1 = je instalováno
  
<h2>Databázový účet pro potřeby fulltextového vyhledávání</h2>
+
==Databázový účet pro potřeby fulltextového vyhledávání==
Fulltextové vyhledávání je vždy prováděno pod účtem "teambridge". Heslo uživatele je nutné zadat stejné, jako je použito pro hlavní databázi enTeam Workflow manager.
+
Fulltextové vyhledávání je vždy prováděno pod účtem "teambridge". Heslo uživatele je nutné zadat stejné, jako je použito pro hlavní databázi enTeam Workflow Manager.
  
 
+
==Úprava konfiguračního souboru parent.ini==
<h2>Úprava konfiguračního souboru parent.ini</h2>
 
 
    
 
    
 
   [M/FULLTEXT]
 
   [M/FULLTEXT]
Řádek 35: Řádek 29:
  
 
   Server: server a databáze fulltextové databáze
 
   Server: server a databáze fulltextové databáze
   DocumentFilter: pomocí standardního filtru enTeam Workflow manager lze omezit indexaci pouze na některé typy souborů
+
   DocumentFilter: pomocí standardního filtru enTeam Workflow Manager lze omezit indexaci pouze na některé typy souborů
   IndexAttachments: indexovat přílohy, true/false (Ano/Ne)
+
   IndexAttachments: indexovat přílohy, True/False (Ano/Ne)
 
   Index***: indexovat přílohu určitého typu
 
   Index***: indexovat přílohu určitého typu
 
   MaxDocSentences: u příloh typu MS Word je nutné určit, kolik prvních vět dokumentů se bude indexovat. Z důvodu ušetření místa se indexuje pouze prvních N vět.
 
   MaxDocSentences: u příloh typu MS Word je nutné určit, kolik prvních vět dokumentů se bude indexovat. Z důvodu ušetření místa se indexuje pouze prvních N vět.
   IndexEMail: indexovat emaily
+
   IndexEMail: indexovat e-maily
 
   Debug: při indexování zobrazovat detailní informace
 
   Debug: při indexování zobrazovat detailní informace
   MaxCaseCount: s ohledem na zatížení serveru je vhodné indexovat historii enTeam Workflow manager po částech. Klíč udává maximální počet indexovaných v rámci jednoho běhu.
+
   MaxCaseCount: s ohledem na zatížení serveru je vhodné indexovat historii enTeam Workflow Manager po částech. Klíč udává maximální počet indexovaných v rámci jednoho běhu.
 
    
 
    
<h2>Pluginy pro vytěžování různých typů příloh</h2>
+
==Pluginy pro vytěžování různých typů příloh==
 
Pro podporu OCR souborů typu TIFF je nutné nainstalovat PumaNet.   
 
Pro podporu OCR souborů typu TIFF je nutné nainstalovat PumaNet.   
 
Pro vytěžování MS Word je nutné na indexačním serveru nainstalovat MS Word.
 
Pro vytěžování MS Word je nutné na indexačním serveru nainstalovat MS Word.
  
<h2>Test indexace</h2>
+
==Test indexace==
 
Pomocí filtru DocumentFilter=$DOC_TITLE='TEST Fulltext' nastavte, které procesy budete indexovat. Vytvořte proces s název "TEST Fulltext" a zapište do něj nějaký text. Spusťte indexování příkazem "MFullTextIndex.exe -index" Pomocí kontextového menu na ikoně "M" vyhledejte část zadaného textu.  
 
Pomocí filtru DocumentFilter=$DOC_TITLE='TEST Fulltext' nastavte, které procesy budete indexovat. Vytvořte proces s název "TEST Fulltext" a zapište do něj nějaký text. Spusťte indexování příkazem "MFullTextIndex.exe -index" Pomocí kontextového menu na ikoně "M" vyhledejte část zadaného textu.  
  
<h2>Automatické indexování</h2>
+
==Automatické indexování==
 
Nastavte naplánovanou úlohu, které bude cca 1x za hodinu spouštět "MFullTextIndex.exe -index"
 
Nastavte naplánovanou úlohu, které bude cca 1x za hodinu spouštět "MFullTextIndex.exe -index"
  
  
  
<h1>Známé problémy</h1>
+
==Známé problémy==
<h2>Při indexaci volané z naplánovaných úloh se neprovádí indexace MS Word dokumentů</h2>  
+
===Při indexaci volané z naplánovaných úloh se neprovádí indexace MS Word dokumentů===  
 
Vytvořte adresář  
 
Vytvořte adresář  
 
"C:\Windows\SysWOW64\config\systemprofile\Desktop" (pro 64 bit Windows)  
 
"C:\Windows\SysWOW64\config\systemprofile\Desktop" (pro 64 bit Windows)  
 
nebo
 
nebo
"C:\Windows\System32\config\systemprofile\Desktop" (for 32 bit Windows)
+
"C:\Windows\System32\config\systemprofile\Desktop" (pro 32 bit Windows)
 +
 
 
Nastavte uživateli, pod nímž se spouští naplánovaná úloha, plné oprávnění pro tento adresář.
 
Nastavte uživateli, pod nímž se spouští naplánovaná úloha, plné oprávnění pro tento adresář.
  
<h2>Ukazatel posledního dne indexace je i přes opakované spuštění stále nastaven na stejný den</h2>
+
===Ukazatel posledního dne indexace je i přes opakované spuštění stále nastaven na stejný den===
Indexace funguje tak, že si indexační nástroj pamatuje poslední zaindexovaný den a indexuje procesy od tohoto dne do budoucna. Pokud zaindexuje celý den, pak je ukazatel posledního indexovaného dne posunut o jeden den v před.
+
Indexace funguje tak, že si indexační nástroj pamatuje poslední zaindexovaný den a indexuje procesy od tohoto dne do budoucna. Pokud zaindexuje celý den, pak je ukazatel posledního indexovaného dne posunut o jeden den vpřed.
 
Pokud však nedojde k indexaci všech procesů změněných v rámci jednoho dne, pak se ukazatel neposune na další den a příští indexaci bude opět indexovat procesy ze stejného dne a k posunu ukazatele nedojde.   
 
Pokud však nedojde k indexaci všech procesů změněných v rámci jednoho dne, pak se ukazatel neposune na další den a příští indexaci bude opět indexovat procesy ze stejného dne a k posunu ukazatele nedojde.   
Hodonta klíče MaxCaseCount pak musí být navýšena. Ukazatel na poslední den indexace je možné zjistit příkazem: "MFullTextIndex.exe -lastindex"
+
Hodnota klíče MaxCaseCount pak musí být navýšena. Ukazatel na poslední den indexace je možné zjistit příkazem: "MFullTextIndex.exe -lastindex"

Aktuální verze z 6. 1. 2021, 00:10

Fulltextové vyhledávání je připraveno tak, že se v naplánovaných intervalech pomocí "Windows scheduleru" volá nástroj "MFullTextIndex.exe", který provádí indexaci naposledy změněných procesů. Vyhledávání je možné buď pomocí ikony červené lupy, nebo Shift + Ctrl + F.

Příprava databázového serveru

Pro fulltextové vyhledávání se vždy využívá MS SQL server, a to bez ohledu na to, zda je enTeam Workflow Manager nainstalován na databázovém serveru Firebird, MS SQL, nebo na Oracle.
a) Pokud je enTeam Workflow Manager nainstalován na MSSQL serveru s podporou fulltextového vyhledávání, pak je vhodné využít tento SQL server.
b) V případě instalace enTeam na jiném typu databáze (Oracle, Firebird), případně na MSSQL serveru bez podpory fulltextového vyhledávání, je možné zdarma využít MS SQL Server Express.

Informaci, zda je ve stávající instalaci SQL serveru podporováno fulltextové vyhledávání, lze získat dotazem:

  SELECT SERVERPROPERTY('IsFullTextInstalled')
  0 = fulltextové prohledávání není instalováno, 1 = je instalováno

Databázový účet pro potřeby fulltextového vyhledávání

Fulltextové vyhledávání je vždy prováděno pod účtem "teambridge". Heslo uživatele je nutné zadat stejné, jako je použito pro hlavní databázi enTeam Workflow Manager.

Úprava konfiguračního souboru parent.ini

  [M/FULLTEXT]
  Server=SQLserver:Database
  DocumentFilter=$DOC_TITLE='*'
  IndexAttachments=false
  IndexDoc=false
  IndexDocX=false
  MaxDocSentences=200
  IndexTif=false
  IndexPdf=false
  IndexEMail=false
  Debug=false
  MaxCaseCount=10000
  Server: server a databáze fulltextové databáze
  DocumentFilter: pomocí standardního filtru enTeam Workflow Manager lze omezit indexaci pouze na některé typy souborů
  IndexAttachments: indexovat přílohy, True/False (Ano/Ne)
  Index***: indexovat přílohu určitého typu
  MaxDocSentences: u příloh typu MS Word je nutné určit, kolik prvních vět dokumentů se bude indexovat. Z důvodu ušetření místa se indexuje pouze prvních N vět.
  IndexEMail: indexovat e-maily
  Debug: při indexování zobrazovat detailní informace
  MaxCaseCount: s ohledem na zatížení serveru je vhodné indexovat historii enTeam Workflow Manager po částech. Klíč udává maximální počet indexovaných v rámci jednoho běhu.
  

Pluginy pro vytěžování různých typů příloh

Pro podporu OCR souborů typu TIFF je nutné nainstalovat PumaNet. Pro vytěžování MS Word je nutné na indexačním serveru nainstalovat MS Word.

Test indexace

Pomocí filtru DocumentFilter=$DOC_TITLE='TEST Fulltext' nastavte, které procesy budete indexovat. Vytvořte proces s název "TEST Fulltext" a zapište do něj nějaký text. Spusťte indexování příkazem "MFullTextIndex.exe -index" Pomocí kontextového menu na ikoně "M" vyhledejte část zadaného textu.

Automatické indexování

Nastavte naplánovanou úlohu, které bude cca 1x za hodinu spouštět "MFullTextIndex.exe -index"


Známé problémy

Při indexaci volané z naplánovaných úloh se neprovádí indexace MS Word dokumentů

Vytvořte adresář "C:\Windows\SysWOW64\config\systemprofile\Desktop" (pro 64 bit Windows) nebo "C:\Windows\System32\config\systemprofile\Desktop" (pro 32 bit Windows)

Nastavte uživateli, pod nímž se spouští naplánovaná úloha, plné oprávnění pro tento adresář.

Ukazatel posledního dne indexace je i přes opakované spuštění stále nastaven na stejný den

Indexace funguje tak, že si indexační nástroj pamatuje poslední zaindexovaný den a indexuje procesy od tohoto dne do budoucna. Pokud zaindexuje celý den, pak je ukazatel posledního indexovaného dne posunut o jeden den vpřed. Pokud však nedojde k indexaci všech procesů změněných v rámci jednoho dne, pak se ukazatel neposune na další den a příští indexaci bude opět indexovat procesy ze stejného dne a k posunu ukazatele nedojde. Hodnota klíče MaxCaseCount pak musí být navýšena. Ukazatel na poslední den indexace je možné zjistit příkazem: "MFullTextIndex.exe -lastindex"