Fulltextové vyhledávání: Porovnání verzí
(→Příprava databázového serveru) |
|||
(Není zobrazeno 5 mezilehlých verzí od stejného uživatele.) | |||
Řádek 1: | Řádek 1: | ||
Fulltextové vyhledávání je připraveno tak, že se v naplánovaných intervalech pomocí "Windows scheduleru" volá nástroj "MFullTextIndex.exe", který provádí indexaci naposledy změněných procesů. Vyhledávání je možné buď pomocí ikony červené lupy, nebo Shift + Ctrl + F. | Fulltextové vyhledávání je připraveno tak, že se v naplánovaných intervalech pomocí "Windows scheduleru" volá nástroj "MFullTextIndex.exe", který provádí indexaci naposledy změněných procesů. Vyhledávání je možné buď pomocí ikony červené lupy, nebo Shift + Ctrl + F. | ||
− | + | ==Příprava databázového serveru== | |
− | Pro fulltextové vyhledávání se vždy využívá MS SQL server, a to bez ohledu na to, zda je enTeam Workflow | + | Pro fulltextové vyhledávání se vždy využívá MS SQL server, a to bez ohledu na to, zda je enTeam Workflow Manager nainstalován na databázovém serveru Firebird, MS SQL, nebo na Oracle.<br/> |
− | a) Pokud je enTeam Workflow | + | a) Pokud je enTeam Workflow Manager nainstalován na MSSQL serveru s podporou fulltextového vyhledávání, pak je vhodné využít tento SQL server.<br/> |
− | b) V případě instalace | + | b) V případě instalace enTeam na jiném typu databáze (Oracle, Firebird), případně na MSSQL serveru bez podpory fulltextového vyhledávání, je možné zdarma využít MS SQL Server Express. |
− | |||
− | |||
− | |||
− | |||
− | |||
Informaci, zda je ve stávající instalaci SQL serveru podporováno fulltextové vyhledávání, lze získat dotazem: | Informaci, zda je ve stávající instalaci SQL serveru podporováno fulltextové vyhledávání, lze získat dotazem: | ||
Řádek 15: | Řádek 10: | ||
0 = fulltextové prohledávání není instalováno, 1 = je instalováno | 0 = fulltextové prohledávání není instalováno, 1 = je instalováno | ||
− | + | ==Databázový účet pro potřeby fulltextového vyhledávání== | |
− | Fulltextové vyhledávání je vždy prováděno pod účtem "teambridge". Heslo uživatele je nutné zadat stejné, jako je použito pro hlavní databázi enTeam Workflow | + | Fulltextové vyhledávání je vždy prováděno pod účtem "teambridge". Heslo uživatele je nutné zadat stejné, jako je použito pro hlavní databázi enTeam Workflow Manager. |
− | + | ==Úprava konfiguračního souboru parent.ini== | |
− | |||
[M/FULLTEXT] | [M/FULLTEXT] | ||
Řádek 35: | Řádek 29: | ||
Server: server a databáze fulltextové databáze | Server: server a databáze fulltextové databáze | ||
− | DocumentFilter: pomocí standardního filtru enTeam Workflow | + | DocumentFilter: pomocí standardního filtru enTeam Workflow Manager lze omezit indexaci pouze na některé typy souborů |
− | IndexAttachments: indexovat přílohy, | + | IndexAttachments: indexovat přílohy, True/False (Ano/Ne) |
Index***: indexovat přílohu určitého typu | Index***: indexovat přílohu určitého typu | ||
MaxDocSentences: u příloh typu MS Word je nutné určit, kolik prvních vět dokumentů se bude indexovat. Z důvodu ušetření místa se indexuje pouze prvních N vět. | MaxDocSentences: u příloh typu MS Word je nutné určit, kolik prvních vět dokumentů se bude indexovat. Z důvodu ušetření místa se indexuje pouze prvních N vět. | ||
− | IndexEMail: indexovat | + | IndexEMail: indexovat e-maily |
Debug: při indexování zobrazovat detailní informace | Debug: při indexování zobrazovat detailní informace | ||
− | MaxCaseCount: s ohledem na zatížení serveru je vhodné indexovat historii enTeam Workflow | + | MaxCaseCount: s ohledem na zatížení serveru je vhodné indexovat historii enTeam Workflow Manager po částech. Klíč udává maximální počet indexovaných v rámci jednoho běhu. |
− | + | ==Pluginy pro vytěžování různých typů příloh== | |
Pro podporu OCR souborů typu TIFF je nutné nainstalovat PumaNet. | Pro podporu OCR souborů typu TIFF je nutné nainstalovat PumaNet. | ||
Pro vytěžování MS Word je nutné na indexačním serveru nainstalovat MS Word. | Pro vytěžování MS Word je nutné na indexačním serveru nainstalovat MS Word. | ||
− | + | ==Test indexace== | |
Pomocí filtru DocumentFilter=$DOC_TITLE='TEST Fulltext' nastavte, které procesy budete indexovat. Vytvořte proces s název "TEST Fulltext" a zapište do něj nějaký text. Spusťte indexování příkazem "MFullTextIndex.exe -index" Pomocí kontextového menu na ikoně "M" vyhledejte část zadaného textu. | Pomocí filtru DocumentFilter=$DOC_TITLE='TEST Fulltext' nastavte, které procesy budete indexovat. Vytvořte proces s název "TEST Fulltext" a zapište do něj nějaký text. Spusťte indexování příkazem "MFullTextIndex.exe -index" Pomocí kontextového menu na ikoně "M" vyhledejte část zadaného textu. | ||
− | + | ==Automatické indexování== | |
Nastavte naplánovanou úlohu, které bude cca 1x za hodinu spouštět "MFullTextIndex.exe -index" | Nastavte naplánovanou úlohu, které bude cca 1x za hodinu spouštět "MFullTextIndex.exe -index" | ||
− | + | ==Známé problémy== | |
− | + | ===Při indexaci volané z naplánovaných úloh se neprovádí indexace MS Word dokumentů=== | |
Vytvořte adresář | Vytvořte adresář | ||
"C:\Windows\SysWOW64\config\systemprofile\Desktop" (pro 64 bit Windows) | "C:\Windows\SysWOW64\config\systemprofile\Desktop" (pro 64 bit Windows) | ||
nebo | nebo | ||
− | "C:\Windows\System32\config\systemprofile\Desktop" ( | + | "C:\Windows\System32\config\systemprofile\Desktop" (pro 32 bit Windows) |
+ | |||
Nastavte uživateli, pod nímž se spouští naplánovaná úloha, plné oprávnění pro tento adresář. | Nastavte uživateli, pod nímž se spouští naplánovaná úloha, plné oprávnění pro tento adresář. | ||
− | + | ===Ukazatel posledního dne indexace je i přes opakované spuštění stále nastaven na stejný den=== | |
− | Indexace funguje tak, že si indexační nástroj pamatuje poslední zaindexovaný den a indexuje procesy od tohoto dne do budoucna. Pokud zaindexuje celý den, pak je ukazatel posledního indexovaného dne posunut o jeden den | + | Indexace funguje tak, že si indexační nástroj pamatuje poslední zaindexovaný den a indexuje procesy od tohoto dne do budoucna. Pokud zaindexuje celý den, pak je ukazatel posledního indexovaného dne posunut o jeden den vpřed. |
Pokud však nedojde k indexaci všech procesů změněných v rámci jednoho dne, pak se ukazatel neposune na další den a příští indexaci bude opět indexovat procesy ze stejného dne a k posunu ukazatele nedojde. | Pokud však nedojde k indexaci všech procesů změněných v rámci jednoho dne, pak se ukazatel neposune na další den a příští indexaci bude opět indexovat procesy ze stejného dne a k posunu ukazatele nedojde. | ||
− | + | Hodnota klíče MaxCaseCount pak musí být navýšena. Ukazatel na poslední den indexace je možné zjistit příkazem: "MFullTextIndex.exe -lastindex" |
Aktuální verze z 6. 1. 2021, 00:10
Fulltextové vyhledávání je připraveno tak, že se v naplánovaných intervalech pomocí "Windows scheduleru" volá nástroj "MFullTextIndex.exe", který provádí indexaci naposledy změněných procesů. Vyhledávání je možné buď pomocí ikony červené lupy, nebo Shift + Ctrl + F.
Obsah
Příprava databázového serveru
Pro fulltextové vyhledávání se vždy využívá MS SQL server, a to bez ohledu na to, zda je enTeam Workflow Manager nainstalován na databázovém serveru Firebird, MS SQL, nebo na Oracle.
a) Pokud je enTeam Workflow Manager nainstalován na MSSQL serveru s podporou fulltextového vyhledávání, pak je vhodné využít tento SQL server.
b) V případě instalace enTeam na jiném typu databáze (Oracle, Firebird), případně na MSSQL serveru bez podpory fulltextového vyhledávání, je možné zdarma využít MS SQL Server Express.
Informaci, zda je ve stávající instalaci SQL serveru podporováno fulltextové vyhledávání, lze získat dotazem:
SELECT SERVERPROPERTY('IsFullTextInstalled') 0 = fulltextové prohledávání není instalováno, 1 = je instalováno
Databázový účet pro potřeby fulltextového vyhledávání
Fulltextové vyhledávání je vždy prováděno pod účtem "teambridge". Heslo uživatele je nutné zadat stejné, jako je použito pro hlavní databázi enTeam Workflow Manager.
Úprava konfiguračního souboru parent.ini
[M/FULLTEXT] Server=SQLserver:Database DocumentFilter=$DOC_TITLE='*' IndexAttachments=false IndexDoc=false IndexDocX=false MaxDocSentences=200 IndexTif=false IndexPdf=false IndexEMail=false Debug=false MaxCaseCount=10000
Server: server a databáze fulltextové databáze DocumentFilter: pomocí standardního filtru enTeam Workflow Manager lze omezit indexaci pouze na některé typy souborů IndexAttachments: indexovat přílohy, True/False (Ano/Ne) Index***: indexovat přílohu určitého typu MaxDocSentences: u příloh typu MS Word je nutné určit, kolik prvních vět dokumentů se bude indexovat. Z důvodu ušetření místa se indexuje pouze prvních N vět. IndexEMail: indexovat e-maily Debug: při indexování zobrazovat detailní informace MaxCaseCount: s ohledem na zatížení serveru je vhodné indexovat historii enTeam Workflow Manager po částech. Klíč udává maximální počet indexovaných v rámci jednoho běhu.
Pluginy pro vytěžování různých typů příloh
Pro podporu OCR souborů typu TIFF je nutné nainstalovat PumaNet. Pro vytěžování MS Word je nutné na indexačním serveru nainstalovat MS Word.
Test indexace
Pomocí filtru DocumentFilter=$DOC_TITLE='TEST Fulltext' nastavte, které procesy budete indexovat. Vytvořte proces s název "TEST Fulltext" a zapište do něj nějaký text. Spusťte indexování příkazem "MFullTextIndex.exe -index" Pomocí kontextového menu na ikoně "M" vyhledejte část zadaného textu.
Automatické indexování
Nastavte naplánovanou úlohu, které bude cca 1x za hodinu spouštět "MFullTextIndex.exe -index"
Známé problémy
Při indexaci volané z naplánovaných úloh se neprovádí indexace MS Word dokumentů
Vytvořte adresář "C:\Windows\SysWOW64\config\systemprofile\Desktop" (pro 64 bit Windows) nebo "C:\Windows\System32\config\systemprofile\Desktop" (pro 32 bit Windows)
Nastavte uživateli, pod nímž se spouští naplánovaná úloha, plné oprávnění pro tento adresář.
Ukazatel posledního dne indexace je i přes opakované spuštění stále nastaven na stejný den
Indexace funguje tak, že si indexační nástroj pamatuje poslední zaindexovaný den a indexuje procesy od tohoto dne do budoucna. Pokud zaindexuje celý den, pak je ukazatel posledního indexovaného dne posunut o jeden den vpřed. Pokud však nedojde k indexaci všech procesů změněných v rámci jednoho dne, pak se ukazatel neposune na další den a příští indexaci bude opět indexovat procesy ze stejného dne a k posunu ukazatele nedojde. Hodnota klíče MaxCaseCount pak musí být navýšena. Ukazatel na poslední den indexace je možné zjistit příkazem: "MFullTextIndex.exe -lastindex"