CRISPRimmunity

Please click to download your results

Overview of predicted results

Overview of the results

Contig_ID	Contig_def	CRISPR array number	Contig Signature genes	Self targeting spacer number	Target MGE spacer number	Prophage number	Anti-CRISPR protein number
NZ_CP040506	Hungatella hathewayi WAL-18680 chromosome, complete genome	7 crisprs	DinG,DEDDh,cas3,cas2,cas1,cas5,cas7b,cas8b1,cas6,RT,csa3,WYL	0	9	6	0

Results visualization

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Crispr_ID: NZ_CP040506_1

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP040506_1

687022-687117

Orphan

Consensus_repeat	Method
TCTCCCGAATATACTGGTAAGCATTGG	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_CP040506_1

>merge|NZ_CP040506|1|687022-687117|CRISPRCasFinder
TCTCCCGAATATACTGGTAAGCATTGGCGATAAGGCTTTTTCATATAATAAGTTTTCAGGTACGCTCTCTCTCCCGAATACACTGGTAAGCATTGG

>NZ_CP040506|1|1|687022-687117|CRISPRCasFinder
TCTCCCGAATATACTGGTAAGCATTGG	CGATAAGGCTTTTTCATATAATAAGTTTTCAGGTACGCTCTC
TCTCCCGAATACACTGGTAAGCATTGG

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP040506.1\|WP_138669417.1\|679305_682164_+\|leucine-rich-repeat-protein	unknown	unknown	gnl\|CDD\|372554
NZ_CP040506.1\|WP_006780539.1\|702620_704066_+\|TrkH-family-potassium-uptake-protein	unknown	unknown	gnl\|CDD\|223246
NZ_CP040506.1\|WP_034858377.1\|668755_669274_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|379164
NZ_CP040506.1\|WP_006780518.1\|667522_668041_+\|pilus-assembly-protein	unknown	unknown	gnl\|CDD\|377921
NZ_CP040506.1\|WP_006780532.1\|691432_694498_+\|leucine-rich-repeat-protein	unknown	unknown	gnl\|CDD\|372554
NZ_CP040506.1\|WP_006780536.1\|700050_701250_+\|ribonuclease-E/G	unknown	unknown	gnl\|CDD\|378414
NZ_CP040506.1\|WP_006780535.1\|699347_700058_+\|radical-SAM-protein	unknown	unknown	gnl\|CDD\|378393
NZ_CP040506.1\|WP_006780529.1\|682238_685247_+\|leucine-rich-repeat-protein	unknown	unknown	gnl\|CDD\|372554
NZ_CP040506.1\|WP_006780534.1\|697498_699364_+\|TIGR03960-family-B12-binding-radical-SAM-protein	unknown	unknown	gnl\|CDD\|188475
NZ_CP040506.1\|WP_138670084.1\|704162_705308_-\|MFS-transporter	unknown	unknown	gnl\|CDD\|340891
NZ_CP040506.1\|WP_006780523.1\|670940_672932_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|223715
NZ_CP040506.1\|WP_138669419.1\|688509_691428_+\|MBL-fold-metallo-hydrolase	unknown	unknown	gnl\|CDD\|224926
NZ_CP040506.1\|WP_006780521.1\|669390_670119_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP040506.1\|WP_006780533.1\|694510_697234_+\|leucine-rich-repeat-protein	unknown	unknown	gnl\|CDD\|275383
NZ_CP040506.1\|WP_006780541.1\|705464_705710_+\|iron-only-hydrogenase-system-regulator	unknown	unknown	gnl\|CDD\|274882
NZ_CP040506.1\|WP_138669415.1\|673106_676193_+\|leucine-rich-repeat-protein	unknown	unknown	gnl\|CDD\|372554
NZ_CP040506.1\|WP_080568828.1\|668021_668747_+\|pilus-assembly-protein	unknown	unknown	gnl\|CDD\|377921
NZ_CP040506.1\|WP_138669421.1\|701251_702607_+\|Trk-system-potassium-transporter-TrkA	unknown	unknown	gnl\|CDD\|236541
NZ_CP040506.1\|WP_006780522.1\|670263_670944_+\|response-regulator-transcription-factor	unknown	unknown	gnl\|CDD\|223816
NZ_CP040506.1\|WP_006780526.1\|676267_679231_+\|leucine-rich-repeat-protein	unknown	unknown	gnl\|CDD\|275383

Protein	Function_ID	Function_description	E-value
NZ_CP040506.1\|WP_138669417.1\|679305_682164_+\|leucine-rich-repeat-protein	gnl\|CDD\|372554	pfam13306, LRR_5, Leucine rich repeats (6 copies). This family includes a number of leucine rich repeats. This family contains a large number of BSPA-like surface antigens from Trichomonas vaginalis.	5.81408e-30
NZ_CP040506.1\|WP_006780539.1\|702620_704066_+\|TrkH-family-potassium-uptake-protein	gnl\|CDD\|223246	COG0168, TrkG, Trk-type K+ transport systems, membrane components [Inorganic ion transport and metabolism].	1.06769e-110
NZ_CP040506.1\|WP_034858377.1\|668755_669274_+\|hypothetical-protein	gnl\|CDD\|379164	pfam13400, Tad, Putative Flp pilus-assembly TadE/G-like. This is an N-terminal domain on a family of putative Flp pilus-assembly proteins. The exact function is not known. The Flp-pilus biogenesis genes include the Tad genes, and some members of this family are putatively assigned as being TadG.	0.00362796
NZ_CP040506.1\|WP_006780518.1\|667522_668041_+\|pilus-assembly-protein	gnl\|CDD\|377921	pfam07811, TadE, TadE-like protein. The members of this family are similar to a region of the protein product of the bacterial tadE locus. In various bacterial species, the tad locus is closely linked to flp-like genes, which encode proteins required for the production of pili involved in adherence to surfaces. It is thought that the tad loci encode proteins that act to assemble or export an Flp pilus in various bacteria. All tad loci but TadA have putative transmembrane regions, and in fact the region in question is this family has a high proportion of hydrophobic amino acid residues.	1.77404e-10
NZ_CP040506.1\|WP_006780532.1\|691432_694498_+\|leucine-rich-repeat-protein	gnl\|CDD\|372554	pfam13306, LRR_5, Leucine rich repeats (6 copies). This family includes a number of leucine rich repeats. This family contains a large number of BSPA-like surface antigens from Trichomonas vaginalis.	4.62199e-33
NZ_CP040506.1\|WP_006780536.1\|700050_701250_+\|ribonuclease-E/G	gnl\|CDD\|378414	pfam10150, RNase_E_G, Ribonuclease E/G family. Ribonuclease E and Ribonuclease G are related enzymes that cleave a wide variety of RNAs.	4.80905e-125
NZ_CP040506.1\|WP_006780535.1\|699347_700058_+\|radical-SAM-protein	gnl\|CDD\|378393	pfam10105, DUF2344, Uncharacterized protein conserved in bacteria (DUF2344). This domain, found in various hypothetical bacterial proteins and Radical Sam domain proteins, has no known function. This domain is distantly related to tRNA pseudouridine synthases, suggesting this family may carry out a function related to RNA modification. But this family appears to lack the catalytic aspartate found in pseudouridine synthases.	3.6002e-83
NZ_CP040506.1\|WP_006780529.1\|682238_685247_+\|leucine-rich-repeat-protein	gnl\|CDD\|372554	pfam13306, LRR_5, Leucine rich repeats (6 copies). This family includes a number of leucine rich repeats. This family contains a large number of BSPA-like surface antigens from Trichomonas vaginalis.	1.82508e-31
NZ_CP040506.1\|WP_006780534.1\|697498_699364_+\|TIGR03960-family-B12-binding-radical-SAM-protein	gnl\|CDD\|188475	TIGR03960, radical_SAM_domain_protein, radical SAM family uncharacterized protein. This model describes a radical SAM protein, or protein region, regularly found paired with or fused to a region described by TIGR03936. PSI-BLAST analysis of TIGR03936 suggests a relationship to the tRNA pseudouridine synthase TruA, suggesting that this system may act in RNA modification. [Unknown function, Enzymes of unknown specificity].	0
NZ_CP040506.1\|WP_138670084.1\|704162_705308_-\|MFS-transporter	gnl\|CDD\|340891	cd17333, MFS_FucP_MFSD4_like, Bacterial fucose permease, eukaryotic Major facilitator superfamily domain-containing protein 4, and similar proteins. This family is composed of bacterial L-fucose permease (FucP), eukaryotic Major facilitator superfamily domain-containing protein 4 (MFSD4) proteins, and similar proteins. L-fucose permease facilitates the uptake of L-fucose across the boundary membrane with the concomitant transport of protons into the cell; it can also transport L-galactose and D-arabinose. The MFSD4 subfamily consists of two vertebrate members: MFSD4A and MFSD4B. The function of MFSD4A is unknown. MFSD4B is more commonly know as Sodium-dependent glucose transporter 1 (NaGLT1), a primary fructose transporter in rat renal brush-border membranes that also facilitates sodium-independent urea uptake. The FucP/MFSD4 family belongs to the Major Facilitator Superfamily (MFS) of membrane transport proteins, which are thought to function through a single substrate binding site, alternating-access mechanism involving a rocker-switch type of movement.	2.05689e-24
NZ_CP040506.1\|WP_006780523.1\|670940_672932_+\|hypothetical-protein	gnl\|CDD\|223715	COG0642, BaeS, Signal transduction histidine kinase [Signal transduction mechanisms].	2.03449e-53
NZ_CP040506.1\|WP_138669419.1\|688509_691428_+\|MBL-fold-metallo-hydrolase	gnl\|CDD\|224926	COG2015, COG2015, Alkyl sulfatase and related hydrolases [Secondary metabolites biosynthesis, transport, and catabolism].	7.73896e-171
NZ_CP040506.1\|WP_006780533.1\|694510_697234_+\|leucine-rich-repeat-protein	gnl\|CDD\|275383	sd00036, LRR_3, leucine-rich repeats. A leucine-rich repeat (LRR) is a structural protein motif of 20-30 amino acids that is unusually rich in the hydrophobic amino acid leucine. The conserved eleven-residue sequence motif (LxxLxLxxN/CxL) within the LRRs corresponds to the beta-strand and adjacent loop regions, whereas the remaining parts of the repeats are variable. LRRs fold together to form a solenoid protein domain, termed leucine-rich repeat domain. Leucine-rich repeats are usually involved in protein-protein interactions.	8.29854e-33
NZ_CP040506.1\|WP_006780541.1\|705464_705710_+\|iron-only-hydrogenase-system-regulator	gnl\|CDD\|274882	TIGR03959, putative_iron-only_hydrogenase_system_regulator, putative iron-only hydrogenase system regulator. Members of this protein family occur as part of a system for producing iron-only hydrogenases, dependent on radical SAM proteins HydE and HydG and GTPase HydF. One member of this family, TM_1266 from Thermotoga maritima, has a known crystal structure. The small size, about 80 residues, and a distant relationship to the nickel regulator NikR of the CopG transcriptional regulator family suggest a role as a transcription factor. [Regulatory functions, DNA interactions].	7.82178e-35
NZ_CP040506.1\|WP_138669415.1\|673106_676193_+\|leucine-rich-repeat-protein	gnl\|CDD\|372554	pfam13306, LRR_5, Leucine rich repeats (6 copies). This family includes a number of leucine rich repeats. This family contains a large number of BSPA-like surface antigens from Trichomonas vaginalis.	1.85403e-28
NZ_CP040506.1\|WP_080568828.1\|668021_668747_+\|pilus-assembly-protein	gnl\|CDD\|377921	pfam07811, TadE, TadE-like protein. The members of this family are similar to a region of the protein product of the bacterial tadE locus. In various bacterial species, the tad locus is closely linked to flp-like genes, which encode proteins required for the production of pili involved in adherence to surfaces. It is thought that the tad loci encode proteins that act to assemble or export an Flp pilus in various bacteria. All tad loci but TadA have putative transmembrane regions, and in fact the region in question is this family has a high proportion of hydrophobic amino acid residues.	2.0669e-10
NZ_CP040506.1\|WP_138669421.1\|701251_702607_+\|Trk-system-potassium-transporter-TrkA	gnl\|CDD\|236541	PRK09496, trkA, Trk system potassium transporter TrkA.	1.56114e-158
NZ_CP040506.1\|WP_006780522.1\|670263_670944_+\|response-regulator-transcription-factor	gnl\|CDD\|223816	COG0745, OmpR, Response regulators consisting of a CheY-like receiver domain and a winged-helix DNA-binding domain [Signal transduction mechanisms / Transcription].	4.46355e-64
NZ_CP040506.1\|WP_006780526.1\|676267_679231_+\|leucine-rich-repeat-protein	gnl\|CDD\|275383	sd00036, LRR_3, leucine-rich repeats. A leucine-rich repeat (LRR) is a structural protein motif of 20-30 amino acids that is unusually rich in the hydrophobic amino acid leucine. The conserved eleven-residue sequence motif (LxxLxLxxN/CxL) within the LRRs corresponds to the beta-strand and adjacent loop regions, whereas the remaining parts of the repeats are variable. LRRs fold together to form a solenoid protein domain, termed leucine-rich repeat domain. Leucine-rich repeats are usually involved in protein-protein interactions.	3.52515e-27

>NZ_CP040506.1|WP_006780529.1|682238_685247_+|leucine-rich-repeat-protein
MKRNHKRVISTLLIMLLISTQPAVMAWADSVVPADHLLGDDENTGKKTGYATPTDADQKDEDAPKPDDAPKGDEIPSTEIPSNKNLTDGKGPENENSGNTEKVVIRWEFVDDDNLIEGELSLIGVSPENRADFDTVVSMLPEQVRVELEETGEVTLPIIGWSCPEYQQDEDEEWPFTGEYEFIAELPEGYVCEPPISVLVTLGGAMVNTINDRFTIDGLNYKELGPDTVQLIGYDGAPVGTLVIPDKVRKPSNGREYQVASIGHYAFLDCSGLTGDLVIPDTVTEIGDMAFSGCHFTGELTLSDSLVTIGEYTFFECGFTGQLVLPQTLTRIGERAFTYTTFSGQLILPEKLNYIGELAFYHCNFTGDLIIPDGVTIINYDTFSGNSFTGTLTLPNKLKEIGNESFFECGFTGELVLPDGLTSIGISAFKDCSKLTGRLSIPDGITSIEQHAFYNTGFTSFDTTKQEIADLLYASGGVQASKIMVEGQPYQLHIQPAPEPDFPVGNMTYRKIGSDTVELTGYEGNSDMDIIIPDTVTDQLSGMTYSVTRIGSSAFYGKAITGSLHLPNTLVSIGDRAFKKNRFTGDLTIPVSVSHMGTGAFDSAGFTGDLTIEGKLTKLEDYVFFKCGFTGALSLPDTLTYVGYAVFKDCGFTGSLQLPAGITYIDAASFYNCSSFTGTLQLPVGVNYIGYNSFFDCSGFTGALQLPKPITEIGEMAFYGCDGLDSAHLGPNVQKLGAQVFPESLPLSTDSPRVQLLINTYLNQNAIADTSWDGNEDVPDGAVATVKQDMTIAGDRRIGTEAVITVPSGVILTVDGNLVVNGTISVEGTMIINGSISGPGTLIIGVNGRVVGDTSGIRVVYVRRGSSGTSGSSAVNPDILIGNWERTEDGIWKFRQTRGTYAANRWGIVDGLWYYFDQEGRMLTGWQYINNQWYYLCREEDIKTKTNLKEGAMATGWHFDLVYQAWFYLDTNGAMAVGEKVIDGKQYYFNPESDGTRGAMQQ
>NZ_CP040506.1|WP_138669417.1|679305_682164_+|leucine-rich-repeat-protein
MKRNRKRVISTLLIALLISTQPAVMAWADSMAPADHLLEDDENTGTKTGYATPADADQKDEDAPKPDDAPKGDEIPSTEIPSNENLTDGKGPENENSGNTEKVVIRWEFVDDDNLSGGELSLIGVSPENRADFDTVVSMLPEQVRAESEEAGEVTLPITRWNCQDYHQDEDGEWPFTGEYEFIAELPEGYVCEPSISVLVTLGGAMVNTINDRFTVDGLKYKELGPDTVQLMGYDGAKPEGTLIIPDKVRKPSNGREYQIVSIFSNAFRDCSGLTGDLVIPDMVTEIGVSAFEGCHFTGELTLPDSLVTIEENAFLKNEFTGQLVLPAKLNYISKNAFYQCNFTGDLIIPDGVTIIEIGAFGYNNFTGTLTLPKKLKGIGRVSFYKSGFTGELNIPDTVTYINNDAFSGCGFTGELDLPDGLTTIGGHAFENCSKLTGRLSIPDEITIIENSAFNNTGFDGFDTTKQEIANLLYASGVDENKIKVGNQPYQPSQTPSAPGFQVGDMEYQIIGSDTVKLTGYHGNSDTDISIPDTVRVSGTTYSVTQIGSYVFYDKAITGSLHLPNTLVSIEGKKAFVGNAFTGDLTIPAGVTHIELGSFEDAGFTGNLTIEGRLTRLEIVTFGRCGFTGTLSLPDTLTYIGEDAFRGCGFTGHLQLPKQVTEIGKRAFYGCDSLDSAHLGPNLQKLWPQAFPEELPLSTDSPRVQLLINAYLNQDAIADTSWDGNEDVPDGALAAVKQDTTVTGDRQIGTEAVITVPSGVILTVDGNLVVNGTISVEGTLIINGSLTGSGTLIVGVNGRVVGDTSGIRVVYVSRGSSGNSGSSAVNPDILIGNWERTEDGIWKFRQARGTYAANRWGIVDGLWYYFDREGRMLTGWQFINNQWYYLCREEDIKTKTNLKEGAMATGWHFDPIYQAWFYLDTSGAMAVGQKVIDGKQYYFNPEPDGTRGAMQQ
>NZ_CP040506.1|WP_006780526.1|676267_679231_+|leucine-rich-repeat-protein
MKRNHKRVISTLLIMLLISTQPAVMAWADSVVPADHLLEGDENTGKKTGYATPTDADQKDEDALKPDDTPKGDEIPSTEIPSTEIPSHENLTDEKGPENENSGKTEKVVIRWEFVDDDNLSGGELSLIGVSPENRADFDTVVSMLPEQVRAEIEEAGKVTLPITDWSCPEYQQDKDGEWPFTGKYEFIAELPEGYVCESPISVLVTLGGAMVNTINDRFTVDGLKYKELGPDTVQLMGYDGAKPVGTLIIPDKVRKPSNGREYQVINISNGAFQDCSGLTGDLVIPDTVTKIGNRAFSKCGFTGQLVLPQTLVRIEHDTFAGTAFSGQLILPEKLNYIGVYAFLDCNFTGDLIIPDEVTDVGYGAFEGNNFTGTLILPKKLKTIDREGFTLCGFTGELNIPDTVTDIGMFAFYKCGFTGDLILPDGLTSIGTSAFEGCSEFTGRLSIPDGITSIGKDAFKNTSFDGFDTTNQEIANLLYASGVDKDKIKVGDQPYQPSQPPKAPGFQVGDMDYQIIGSDTVALTGYHGNSDTDIIIPDMVTDIVSGRTYPVTHIGSDAFWKKAITGSLHLPNTLISIEEGAFAENKFTGSLLLPESLVSIGVGAFYDSGFTGDLTIPANVSYIGPSSFEKAGFTGDLTIEGKLTKLEGYEFIGCGFTGALVLPDTLTSIGDLTFQDCGFTGSLQLPKLVTEIGEKAFYGCDSLDSVYLGPNLQKLGAQAFPESLPLSTDSPRVQLLINTYLNQDAIADTSWDGKEDVPDGAVVTIKQDTTVTGDRRIGTEAVITIPSGVILTVDGNLTVDGNLVVDGTISVEGTLSINGSLSGSSTLIVRVNGRIVGDTSGIRVVYVSHGSSGNSSSSTVNPDILIGTWERTEDGIWKFHQARGTYAVNRWGIVDGLWYYFDKEGRMLTGWQYINNQWYYLCREEDSKTNTGLKEGAMATGWHFDPVYQAWFYLDTSGAMAVGEKVIDGKQYYFNPESDGTRGAMQQ
>NZ_CP040506.1|WP_138669415.1|673106_676193_+|leucine-rich-repeat-protein
MKRKYKQVISTLMAVLLISTQPAVMAWADSVVPADHLLEGDENTGKKTRYATPADADQKDEDALKPDDTPKGDEIPSVEIPSTEIPSHKNLTDGKGPENENSGNTEKVVIRWEFVDDDNLSGGELSLIGVSPENRADFDTVVSMLPDKLRVEIEETGEVTLPIIGWTCQEYHQDEDEEWPFTGEYEFIAELPEGYVCEPPISVLVTLGGAMVNTINDRFTVDGLRYKELGPDTVQLIGYDGAKPTGLLVIPEHVRKPSNDREYQVISIGFEAFLDCSGLTGDLVIPDTVTEIGNNAFKGCHFTGELTLSDSLVTIGEYAFNDCGFTGQLDLPQTLTRIGLSAFAETTFSGQLILPEKLNYIGIYAFADCNFTGDLIIPEGMTNTGYGAFEGNSFTGTLTLPKKLKEINRESFFLCGFTGELNIPDTVTDIGSYAFSECGFTGGLVLPDGLTSIGSYAFKDCSELTGRLSIPDEITSIGDNPFTGTGFEGFDTTKQEIADLLYASGVDKNKIKVGNQPYQPASSPQEFSEGDMDFQVIGNNTVKVTDYRGNSNTDIVIPDTVTDRVSGKTYTVTHIGSYAFGSKNITGSLYLPNTLVSIEDSAFMLNRFTGILSLPESLNTIGGAAFYDNNFTGDLTIPENVSHIGASAFESAGFTGNLIIKCKLTYLKDQAFSNCGFTGTLSLPDTLTAIGGYTFKNCGFTGSLQLPAGITSIGESSFFGCNSFTGELYLPKPVTEIGEKAFYGCSSLNSAHLGSNLQKLGIQAFPESLPLSTDSPRVQLLINTYLNQNAIADTSWNGKEDVPDGAVATVKQDTTITGDRRIGTEAVITVPSGGILTVDGNLVVDGMISVEGTLVINGSLSGSGTLIIGVNGRVVGDTSGIRVVYVSRGSSGNNSGSSSTVNSNILLGTWERTEDGIWKFRQTRGTYAANRWGIVDGLWYYFDREGRMLTGWQFINNQWYYLCREEDIKTKTNLKEGAMATGWHFDPVYQAWFYLDTSGAMAVGQKMIDGKQYYFNPEPDGTRGAMQQ
>NZ_CP040506.1|WP_006780523.1|670940_672932_+|hypothetical-protein
MKRFLVIFFLILALCTGMFFSMSVSSVSEGPEAVNGVLDFRGTDFTSSVYHLNGQWEFYYDCLYTPEDFRQGVPTGGEFLTLPNSWNVNGYPALGHATFRLLIQAEPGEHYLLFIPEIISSAVIWSNGTELYRAGVVGDSAANTVTGVRNELLAVSPEDGVIELVVQTANYHLTGSGLFYPMMFGRDTVMLHHFVWQRTAAAAAMGGILLIGVYHLFLYLFRRLERLYLIFSVTCLVTVLRLVMETNSMVQYFFRDGLTFLLNRVYLLLFAFHSICICLFMLEAFSLQLSRRLRRVVMACFLLPVLGVFLLPNTAAVACLFLALIPNGLAAVLALRSGKIGRDPYRLLYLFSLILFIVYAPLTKTVLEAKLYIPGVVSNLFLILSQCVMLSRSYADAHEQVERVNENLERLVEERTAQLNNTNRQLAASQDALREMIGNISHDLKTPLTVLNNYLELLGDDSIASNEQERAEYIGIAYHKNLDLQRLIHNLFEVTRMESGTVMYHPEWVQGSHLMEEVERKYANLICDRELSFSVHVDDTVDLKIDRHKIWSVLDNLIYNALRHTPKGGSISLCLRGNGEQAVLTVSDTGEGISAEHLPHIFERFYKVSPDRGEKDGSSGLGLYIVKTTMEAMGGTVEVESTLGEGTVFTLTLPARIQSSDEK
>NZ_CP040506.1|WP_006780522.1|670263_670944_+|response-regulator-transcription-factor
MDDSYRLLAVDDEPDILRTNRRYLEARGYRVDTAVCAADALELLKNQKYDAILLDVLLPDMNGFALCEAVRALTSAPILFLSCMDGEEDKIKGLMAGGEDYITKPYSLKELAARVYAQVRRGSMKRFVIDHQNRLLQIDNQIIPLSQKEFELFLFLMDHSGQILPAAELYQEVWRTGKPDSANTVAVHITRLRHKLEDAGSVIGRIETVRGEGYRFIPKLEARATI
>NZ_CP040506.1|WP_006780521.1|669390_670119_+|hypothetical-protein
MITPMTKTLETELLWSEEELTKKSKMKNEGAGLLLLGIGILAAGVCNHLLLQIIYESRIIWSAVTICCVLLGIVLAWFGIKLINKVGASVAEETAKDSGYTAKEILECYQESRQPSTLLLSLSSSPSKEKDFMEVGFLTKNWLKLPKNIFCGIMRISDVAAIWYEETALPGYDPGIFVVKSDGKLRYVKCKSDAGREIVDAITARNSKSITIRKFMFDGNEYDAFQSPQKTADIYRITQYER
>NZ_CP040506.1|WP_034858377.1|668755_669274_+|hypothetical-protein
MFKHWFKTWLKKEEGNAMIMGAFGIILLLMFMGIMVDMGLYFTSYRRLSAVTKYSSEEIQQMLPYYSFANDYESAFRTEFNKNLYEYGYTLDNVDRSTITRINTSRLGNPIISVEMDVALHDTYQCIFLPIIGISELPVNASRKTAQSYGIEKRYTAGMPVELWTGGVELDD
>NZ_CP040506.1|WP_080568828.1|668021_668747_+|pilus-assembly-protein
MMLISHKKGDGNMSGRWKKLKRESGQAMVEFALVLPILLLAIIGCMEVAWYMTAKYNLNQYAEAVGRNVKGPYMLIWYHDVHPNDWVVESTGRKPSWLSPEEQALWSFDEYDGWFAFADPGPGETIDPWYYSYAFDSEILFKKRLQGLVTMIDPDKVNYTIRGGWYINAEVLHVPGKKASWAAPRDGEKIEYYSADVRVDMTYRYEPLTVVGQWMFCHGTDYLTMKVDGRYVYNLPPGINT
>NZ_CP040506.1|WP_006780518.1|667522_668041_+|pilus-assembly-protein
MNKFIKRWRRLLSRREEGQSLVEFAFVFPVLLIFFSGIADTGWMIYNYISLADMTDTAVHANIKSNPSDAEDFISLYIEKSFPEFNGSAIQLSADTQVTRYDYYDYVYKSNKNKHWKVPMYYKVLKTTLDINYQVDYLTPMGKLIFGDTDNHMDLSAHSSAVKVLENDAYKP
>NZ_CP040506.1|WP_138669419.1|688509_691428_+|MBL-fold-metallo-hydrolase
MKKMKSLTAGKPSQLTIAQNRYEKIRIGVDPKYDPEYDPEYDPEYDTEYELALKGKCLCGCGDIAISDVWNQEAYRFLKQDYPDNFDHPNERFAAVHPSLWSNGRNNQINGIFEVIKDSIYQVRGYDMANISFVRTRNGWLVLDTLMSEECTYAALELAEDYFSKLGAAFKLQGNIKGIIISHSHVDHFGGVKAVCSYNLAGSTDLNGSYSYEELTKNCPIYAPSGFTEASVSENAYAGNAMGRRASYQYGSFVKPDKEHPDAEENWRRSISIGIGQGQSTGKVGFLKPTNIIDENTPPITIDGLEIDCQLTPGTEAPSEMNHYFPRYKALWMAENCAGTLHNLYTLRGAQVRDGNAWAKYLVETAERYGDKAEVIFQAHNWPHWKNETGTLSLKDFLLETASIYKFINDQTLLYLNQGFKMEEAAQKLRLPYALEHNWNLKPYYGTPSHDAKAVYQKYLGWYDANPIHLNPLSPEERAKAMAGYLTRSLNGESLKDSLEHDLDEGKYRTVADFAYQMYLAGGAGDCNAGHAKDLCAEALRQLAYTSESGPWRNCYLAGAWELEQGKERIHASMGTDLISNMEPYMLLDYIGILYDGDKSVEYDELGHHRNDMEFIMDITEGNKMTRFHIYIRNGAILYYQYKPEELSKPLPGEICHFSLGKEELIQLLAPPSIGQKTLDERIQALKVENSGKSFLNLIFYNLVNLKNDRFQTFDIVTPHDREFLTESEKKVDLREETKACIRMLEGHLKSIADFGDYDLLAFDEQGMNEWLETDGFHSILVKEAQVVEDTNFFAPAPVTKSKDWQNNLGIGPDGFFCKYEYIQVLESCYRFLAEPFLMGADHVHKDDRFTEKTMYLKKAILLLEPYLNRYRQNFRYDVIIENDQMRLQGNDAKAWDELKGKIFSDFDSRFFHEIPQLPKDGIVYGRQLAYTLYLLYQELYCQYVDGGVPVPEKERTAVIKEYRKPHYKKEE
>NZ_CP040506.1|WP_006780532.1|691432_694498_+|leucine-rich-repeat-protein
MKRNHKRAISAMLIVLLISTQPAVMAWADSVAPTDHFLEDDGNTGTKTGYATPADADQKDEDAFKPDSTPKGDEMPSHEIHSKENLTDGKQPENEISEKTVLQWEFVDDDYLDGGELSLIGVSPENRADFDTVISMLPEQVRVEIEETGEVTLPIIDWSCQEYQKDEDGEWPFTGEYEFIAELPEGYVCEPPISVLVTLGGAMVNTINDRFTVDGLKYKELGPDTVQLMGYDGVTPVGTLVIPDKVRKPSNGREYQVASIGHNAFPNCSGLTGDLVIPDTVTEIGDSAFRGCHFTGELTLSDSLVTIGEDAFYECGFTGQLVLPQTLTRIGDYAFENTTFSGQLILPENLNYIGTAAFYLCNFTGDLIIPDGVTIIDYGAFYGNSFTGTLTLPKKLKGISSESFCRSGFTGELNIPDTVTDIGESAFAGCGFTGELILPDGLTNIGPYAFMDCSKLTGRLSIPDEITSIGDDAFDNTGFDGFDTAKQEIADLLYASGVDMNKIKVGNQSYQPAFSPQKFTEGGMEYQVIGSDTVALTGYNGNSDTDISIPDKVTNRLSGTTYFVTHIGSEAFYNKAITGSLHLPNTLVSIGDSAFYKNRFTGDLTIPANVSHMGSGAFEFAGFTGDLTIEGKLTKLEDYEFFECGFTGALSLPDTLTYIGVAVFRDCGFTGSLQLPAGITYIDASSFFNCNSFTGTLQLPAGVNYIGDYGFFNCSGFTGVLKLPKPITEIGELAFFGCDGLDSAHLGPNVQKLGAEAFPESLPLSTDTPRVQLLINTYLNQDVIADTSWDGMEDVPDGAVATVKQDTTVTGDRRIGTEAVITVPSGVILTVDGNLVVDGTIFVDGTLIINGSLSGSGTLIIGANGRVVGDTSGIHVVFLNRGSSGNNSGSSSTVNPNLLIGTWERTEDGIWKFRQARGTYAANRWGIVDGLWYYFDKDGRMLTGWQFINNQWYYLCREEDIKTKTGLKEGAMATGWHFDPVYQAWFYLDTSGAMAVGQKMIDGKQYYFNPEPDGTRGALQQ
>NZ_CP040506.1|WP_006780533.1|694510_697234_+|leucine-rich-repeat-protein
MQKKTTNQIISIVFIVFLMSTQPAVMAWADSVAPADLFLEDDGNTGKKTGYATPTDADQKDEDVLEPDDMSKDKIFEKVVVQWEFVDDDNLSGGELSLIGVSPENRADFDTVVSMLPEQVRAEIEMAGEVTLPITDWSCPKYQKDEDGEWPFTGEYEFIAELPEGYVCEPPISVLVTLGGAMVNTINDRFTVDGLNYKELGPDTVQLIGYDGAKPTGTLVIPDHVRKPSNGREYQIVSIGSEAFLGCSGLTGELQIPDAVTSIGNFAFFNTSFTGTLILPDQLVLIGNSVFSNCSFTGDLTIPEGVASIGSRAFYNAGFTWKLTLPEGLTKIESGTFTNCGFTGELKIPDTVTFIDKQAFENCGFTGQLLFPDGVTGISDRAFYGCGSFTGRLSLSDKVSVIGNDAFYGTNFEGFDTTALLTANLLYDSGIPENMIQLVNSPYQYKGVKFLDGNMEYYDLTNSKCRLTSYYGNIRDDISIPALAKNPLESRFLVSEIGSNVFKGKNITGTLQLSSGLESIEDGAFSGNSFAGNLTIPESVSHIGSAAFEHAGFTGTLTLPNTLTSIEEQTFYGCGFKSLDLPEGLTSIGTASFGHCTSVSGVLYLPESVTEIGDSAFYGCDSLEAVHLGRNVKKLGRKAFPESTPLYTDSPQVQLLINTYLNRNTIADTSWNGGEDVPDGAIASLKQDVVVTGDKRIGTEAVITVPDGRNLTVDGNLTLDGTLVIHGSISGTGTIYVGKNGKITGDTSGVHVVYPSLPPGGDNDNNNSSSNSSGSSSSAVNPNLLIGTWERTEDGIWKFRQARGTYAANRWGIVDGLWYYFDKEGRMLTGWQFINNQWYYLCREEDIKTKTGLKEGAMATGWHFDPVYQAWFYLDTSGAMAVGQKMIDGKQYYFNPESDGTRGALQP
>NZ_CP040506.1|WP_006780534.1|697498_699364_+|TIGR03960-family-B12-binding-radical-SAM-protein
MRKLALPDEILLSIQQPARYIGGEVNTVNKDLSQVEIRFAMCFPDVYEIGMSHLGIQILYDMFNRREDIWCERVYSPWTDLDKIMREEKIPLFALESQDPVKDFDFLGITLQYEMSYTNILQILDLSQIPLHASGRSESDPIVIGGGPCAYNPEPLAEFFDIFYIGEGETSYYELMDRYKENKKQGGSRLSFLEMAAEIPGIYVPAFYDVTYKEDGTIESFLPNNPHAKPVIEKVVVKEMDTVYYIEKPIVPFIKVTQDRVVLEIQRGCIRGCRFCQAGNVYRPLREHGLDYLKDYAYKMLKSTGHEEISLSSLSSSDYTQLEGLVNFLIDEFKGKGVNISLPSLRIDAFSLDVMSKVQDVKKSSLTFAPEAGSQRLRDVINKGLTEEVILQGAAEAFKGGWNRVKLYFMLGLPTETVEDMEGIALLSEKVAEEYYEIPKDQRNGRVQVVASSSFFVPKPFTPFQWARMCTKEEFLERAYIVKDKFREMKNFKSLKYNYHEADLTVLEGVLARGDRRTGALIEETYRQGALFESWSENFNNQLWMDAFETCGIDPDFYTVRERSLDEIFPWDFIDAGVTKEFLKREWLQAIDEKVTPNCRQRCSACGARKYEGGVCYEGKN
>NZ_CP040506.1|WP_006780535.1|699347_700058_+|radical-SAM-protein
MKVRIKFTKHGAMKFIGHLDIMRYFQKAMRRADVDIKYSEGFSPHQVMSFAAPLGVGLTSNGEYMDIEVNSMKDSKTMVHQLNEVMVEGIEVLSCRRLEDTAKNAMSMVAAADYTVRFRDRARPDDMDAFFEELISFYGRESIVITKKTKRGEREVDLKPLIYDLHREGDAIFLQLSTGSSDNIKPELVLEAFYSGKGQTFSELDIQIQREEVYGNTGDEEHRVLTPLEDFGEDIE
>NZ_CP040506.1|WP_006780536.1|700050_701250_+|ribonuclease-E/G
MNKFIITRWEGRVLTALINEEGVFQLGLEDDGEKSLLNNIYIGKVKNVVKNIGAAFVELGNGQMAYYSLTENTRHHYTKPHGNGPLHAGDEIIVQVSKDAVKTKDPVISSNLNFTGRYSVLTAGKDVLGFSAKIADQEWKQEMKARIAPELEDGCGIIVRTNAYGADAGEILAEIRELKTCYKTVMAAGTYRTCYSLLYEAAPSYVGSLRDARNGSIDEIITDDDEICQTLSVYLGKEQPEDLGKLTLYQDSMVSLLKLYSLEKALEEASGRRVWLKSGGYLVIEPTEALTVVDVNTGKYTGKKNPRETILKINLEAARETARQMRLRNLSGIIIIDFIDMTEEEDRKLLMDSLTQWCQKDPVKTTVVDITKLNLVEVTRKKQRRPLHEIMGDNKRRLM
>NZ_CP040506.1|WP_138669421.1|701251_702607_+|Trk-system-potassium-transporter-TrkA
MKIIIVGCGKVGSSLAEQLYMEGHEITLIDRDADVLGAITNSIDVMGMVGNGAVYKVQMEAGIEDTDLLIATTNSDELNMLCCLIAKKAGNCQTIARIRNPEYAEEIRYIREELNLSMAINPELAAAREMSRLLRFPSAIKIDTFAKGRVEILKFIIPEHSVLHNMQVYEVTPKLRCNVLICAVERGEDVIIPNGNFQMMGGDKVYFVAPPVESMKFFKEVGIVNNSIKTAMFVGGGRITYYLAKMLQDTPIQIKIIEQDFERCKVLSEELPNVMVIHGDGSNQQVLLEEGIRQTEAFASLTGFDEENIMLSLYAASQSKAKLITKVNRIAFENVIESMNLGSIIYPKLITADSILQYVRAMQNSLGSNVETLYKIVANRAEALEFRVEKNAPMIGVPLEKLSLKDNLLVACINRNGKIITPRGKDTIEEHDTVIIVTTNTGLNDLKDILK
>NZ_CP040506.1|WP_006780539.1|702620_704066_+|TrkH-family-potassium-uptake-protein
MNIGIVRYFLGWVLNIEAFLMLLPCATAVVYQDHTGIYFLIVMIMCWFLGWLAVHRKPKNTVFYAREGFVTVALSWVLLSFFGALPFWISGEIPSLADAVFETISGFTTTGASILNNVEGLSQSMLMWRSFTHWVGGMGVLVFLLAILPLAGGGYSMHIMRAESPGPSVGKLVPKVKATAKLLYLIYFSMTVIEVILLLAGKMPLFDALTTGFGTAGTGGFGIKNNSIAFYDSYYLQGVITIFMILFGINFNVYYLFLFKRPKEALKSEEARTYLGIILVSTLLIAWNVRSFFPTLFDAFHHAAFQVASIITTTGFSTVDFDVWPQFSKTILIWLMFIGACAGSTGGGMKVSRFIIWIKETLKELASLIHPRSVKVMKLEGKPIEHNIVRSANAYFIVYILIFASSVLLVSLDEFDFNTTFTAVAATFNNIGPGMGGVGPASNFSEFSVMSKLVLMFDMLAGRLEIFPMLLLFSPGTWRKQ
>NZ_CP040506.1|WP_138670084.1|704162_705308_-|MFS-transporter
MNYPVFLRCCYGYAVSGMSVLVVGAILPSLIREAGLSYALAGGLLSMMAIGNLFASLFFPAMVSAIGKRMAITIMASIVPCSYLVLTFLPGIPVMYLIMALVGVARGSITIINNATVNEISNNSNKMVNLLHCSFAVGAFLAPFLTALLSYAGFTWKSIMYVIIALCVTSTLSYATMEYPSDGREKKHQNLSEKHAFLKSFDFYCIGFVLFFYLGVENCINGWFVTYLQSTGIMTETFATTMVSFTWLVIMAGRLVCASLSKHYSKSAIVLMNAIGSGICFFILISSSWLPVITVALLGFGFFLAGIYPGCIANAGPIIGGSTMGMSVLTAISAMGGIITPQLVGSAADRIGLVAAIGILSVNVIVVIVLSAINFRRLRQR
>NZ_CP040506.1|WP_006780541.1|705464_705710_+|iron-only-hydrogenase-system-regulator
METRIAVIGIIIEDKESVALVNEILHQYGSYIIGRMGLPYEKKQVNIISVVVDAPGDIISALSGKLGNIRGVSAKALHSKA

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP040506_2

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP040506_2

3206890-3208870

TypeI-B

Consensus_repeat	Method
ATTTAAATACAGCTACTGTTCTTCTTCAAC	CRISPRCasFinder
ATTTAAATACAGCTACTGTTCTTCTTCAAC	CRT
ATTTAAATACAGCTACTGTTCTTCTTCAAC	PILER-CR

30 spacers

cas2,cas1,cas3,cas5,cas7b,cas8b1,cas6

The CRISPR arrays of NZ_CP040506_2

>merge|NZ_CP040506|2|3206890-3208870|CRISPRCasFinder,CRT,PILER-CR
TATTTAATACAGCTACTGTTCTTCTTCAACCCATGTCGACAACGCAGACCCATACGGCATCTAATTTAAATACAGCTACTGTTCTTCTTCAACTTGCTCCTTTCACAATGCCTCCAAAAACCTTATCATTTAAATACAGCTACTGTTCTTCTTCAACTTATTGCTGCCAAGTCCAGCATACATCTCAAATGATTTAAATACAGCTACTGTTCTTCTTCAACCAATATCTCGCTTTTTGTTCTCATTTTGCTACCTCCATTTAAATACAGCTACTGTTCTTCTTCAACCCATAAGGTCCTGGAAACCATTTTTCTGTATGCAAATTTAAATACAGCTACTGTTCTTCTTCAACAAAAATGGGGACGGCTTGGTGGTTGGCAATTATACATTTAAATACAGCTACTGTTCTTCTTCAACAGGATATGAAATACAAAAATAAAGAGGGGTATTAATTTAAATACAGCTACTGTTCTTCTTCAACCATGGTCAAATGGCTCGGTAGAGGCTGCACCGTTATTTAAATACAGCTACTGTTCTTCTTCAACCTTTGAAAACCGCTGTTTCCTCAAGTGACTGTTGATTTAAATACAGCTACTGTTCTTCTTCAACGAACAGACGGAGACCGGCGCCGATGAGGAGACTGGATTTAAATACAGCTACTGTTCTTCTTCAACACATCCTCGACGAAGGAATACAAAACTTATCAAAGAATTTAAATACAGCTACTGTTCTTCTTCAACGTTCCAAAGTTTCCACACATCCATCTTGCGTAGTTATTTAAATACAGCTACTGTTCTTCTTCAACTGATGACCCATCTTATATCATGGGAAAAAAATTACAATTTAAATACAGCTACTGTTCTTCTTCAACTTATACTCAAATTGCGATATCGCAACAGAAAGGAATTTAAATACAGCTACTGTTCTTCTTCAACTTTTCATTTACTCCTGCAACAACAAACACTCTTTCATTTAAATACAGCTACTGTTCTTCTTCAACATGCTGAAATCTGGTTGATTCCAGACGCAATATTGCATTTAAATACAGCTACTGTTCTTCTTCAACAATTAAGAAACTTCTTTACCTGCACTTTACCATGGAATTTAAATACAGCTACTGTTCTTCTTCAACGATAAAGATAACCGACAGCGTTGCAATACCGTTCGTATTTAAATACAGCTACTGTTCTTCTTCAACAGGACCTGGGTCAGAACAAAATCATCATCCGGTACCATTTAAATACAGCTACTGTTCTTCTTCAACATCTTTTCCACCGGACCAACTTACCATATAGTGCAATTTAAATACAGCTACTGTTCTTCTTCAACCGGGTACCAGTACCCCTATACCGGTCATATCCTTAAATTTAAATACAGCTACTGTTCTTCTTCTACGAAGAAGGGAGGGGATGCCGATGGAGAAGGAGATTCATTTAAATACAGCTACTGTTCTTCTTCAACGTCTCAAGGTAAAATAACTGGCCGAAACAGGAAATTATTTAAATACAGCTACTGTTCTTCTTCAACAGGGAAATCAGCTGCGGGTATGAGTGCAGCTATGTATTTAAATACAGCTACTGTTCTTCTTCAACGCATTCTCCATGGCGGTTAGAAGGGTGGCTTCCGTGATTTAAATACAGCTACTGTTCTTCTTCAACACTGCATGTCTGTCTTCTTAATCAATCCGATAGCATTTAAATACAGCTACTGTTCTTCTTCAACTGTATACCGGTGTCAATCAGGAAGGACAGACCTAATTTAAATACAGCTACTGTTCTTCTTCAACAGTTTGTCCATCTTGGTCTTTAACTCTAAAAGAGTATTTAAATACAGCTACTGTTCTTCTTCAACGCTATAACCGGATTCTTTATACGCATATGATATTGAATTTAAATACAGCTACTGTTCTTCTTCAACGATATTATGGCGACAAACAGGGAGCTGCCGGACAATTTAAATACAGCTACTGTTCTTCTTCAAC

>NZ_CP040506|2|2|3206890-3208870|CRISPRCasFinder
TATTTAATACAGCTACTGTTCTTCTTCAAC	CCATGTCGACAACGCAGACCCATACGGCATCTA
ATTTAAATACAGCTACTGTTCTTCTTCAAC	TTGCTCCTTTCACAATGCCTCCAAAAACCTTATC
ATTTAAATACAGCTACTGTTCTTCTTCAAC	TTATTGCTGCCAAGTCCAGCATACATCTCAAATG
ATTTAAATACAGCTACTGTTCTTCTTCAAC	CAATATCTCGCTTTTTGTTCTCATTTTGCTACCTCC
ATTTAAATACAGCTACTGTTCTTCTTCAAC	CCATAAGGTCCTGGAAACCATTTTTCTGTATGCAA
ATTTAAATACAGCTACTGTTCTTCTTCAAC	AAAAATGGGGACGGCTTGGTGGTTGGCAATTATAC
ATTTAAATACAGCTACTGTTCTTCTTCAAC	AGGATATGAAATACAAAAATAAAGAGGGGTATTA
ATTTAAATACAGCTACTGTTCTTCTTCAAC	CATGGTCAAATGGCTCGGTAGAGGCTGCACCGTT
ATTTAAATACAGCTACTGTTCTTCTTCAAC	CTTTGAAAACCGCTGTTTCCTCAAGTGACTGTTG
ATTTAAATACAGCTACTGTTCTTCTTCAAC	GAACAGACGGAGACCGGCGCCGATGAGGAGACTGG
ATTTAAATACAGCTACTGTTCTTCTTCAAC	ACATCCTCGACGAAGGAATACAAAACTTATCAAAGA
ATTTAAATACAGCTACTGTTCTTCTTCAAC	GTTCCAAAGTTTCCACACATCCATCTTGCGTAGTT
ATTTAAATACAGCTACTGTTCTTCTTCAAC	TGATGACCCATCTTATATCATGGGAAAAAAATTACA
ATTTAAATACAGCTACTGTTCTTCTTCAAC	TTATACTCAAATTGCGATATCGCAACAGAAAGGA
ATTTAAATACAGCTACTGTTCTTCTTCAAC	TTTTCATTTACTCCTGCAACAACAAACACTCTTTC
ATTTAAATACAGCTACTGTTCTTCTTCAAC	ATGCTGAAATCTGGTTGATTCCAGACGCAATATTGC
ATTTAAATACAGCTACTGTTCTTCTTCAAC	AATTAAGAAACTTCTTTACCTGCACTTTACCATGGA
ATTTAAATACAGCTACTGTTCTTCTTCAAC	GATAAAGATAACCGACAGCGTTGCAATACCGTTCGT
ATTTAAATACAGCTACTGTTCTTCTTCAAC	AGGACCTGGGTCAGAACAAAATCATCATCCGGTACC
ATTTAAATACAGCTACTGTTCTTCTTCAAC	ATCTTTTCCACCGGACCAACTTACCATATAGTGCA
ATTTAAATACAGCTACTGTTCTTCTTCAAC	CGGGTACCAGTACCCCTATACCGGTCATATCCTTAA
ATTTAAATACAGCTACTGTTCTTCTTCTAC	GAAGAAGGGAGGGGATGCCGATGGAGAAGGAGATTC
ATTTAAATACAGCTACTGTTCTTCTTCAAC	GTCTCAAGGTAAAATAACTGGCCGAAACAGGAAATT
ATTTAAATACAGCTACTGTTCTTCTTCAAC	AGGGAAATCAGCTGCGGGTATGAGTGCAGCTATGT
ATTTAAATACAGCTACTGTTCTTCTTCAAC	GCATTCTCCATGGCGGTTAGAAGGGTGGCTTCCGTG
ATTTAAATACAGCTACTGTTCTTCTTCAAC	ACTGCATGTCTGTCTTCTTAATCAATCCGATAGC
ATTTAAATACAGCTACTGTTCTTCTTCAAC	TGTATACCGGTGTCAATCAGGAAGGACAGACCTA
ATTTAAATACAGCTACTGTTCTTCTTCAAC	AGTTTGTCCATCTTGGTCTTTAACTCTAAAAGAGT
ATTTAAATACAGCTACTGTTCTTCTTCAAC	GCTATAACCGGATTCTTTATACGCATATGATATTGA
ATTTAAATACAGCTACTGTTCTTCTTCAAC	GATATTATGGCGACAAACAGGGAGCTGCCGGACA
ATTTAAATACAGCTACTGTTCTTCTTCAAC

>NZ_CP040506|2|1|3206890-3208870|CRT
TATTTAATACAGCTACTGTTCTTCTTCAAC	CCATGTCGACAACGCAGACCCATACGGCATCTA
ATTTAAATACAGCTACTGTTCTTCTTCAAC	TTGCTCCTTTCACAATGCCTCCAAAAACCTTATC
ATTTAAATACAGCTACTGTTCTTCTTCAAC	TTATTGCTGCCAAGTCCAGCATACATCTCAAATG
ATTTAAATACAGCTACTGTTCTTCTTCAAC	CAATATCTCGCTTTTTGTTCTCATTTTGCTACCTCC
ATTTAAATACAGCTACTGTTCTTCTTCAAC	CCATAAGGTCCTGGAAACCATTTTTCTGTATGCAA
ATTTAAATACAGCTACTGTTCTTCTTCAAC	AAAAATGGGGACGGCTTGGTGGTTGGCAATTATAC
ATTTAAATACAGCTACTGTTCTTCTTCAAC	AGGATATGAAATACAAAAATAAAGAGGGGTATTA
ATTTAAATACAGCTACTGTTCTTCTTCAAC	CATGGTCAAATGGCTCGGTAGAGGCTGCACCGTT
ATTTAAATACAGCTACTGTTCTTCTTCAAC	CTTTGAAAACCGCTGTTTCCTCAAGTGACTGTTG
ATTTAAATACAGCTACTGTTCTTCTTCAAC	GAACAGACGGAGACCGGCGCCGATGAGGAGACTGG
ATTTAAATACAGCTACTGTTCTTCTTCAAC	ACATCCTCGACGAAGGAATACAAAACTTATCAAAGA
ATTTAAATACAGCTACTGTTCTTCTTCAAC	GTTCCAAAGTTTCCACACATCCATCTTGCGTAGTT
ATTTAAATACAGCTACTGTTCTTCTTCAAC	TGATGACCCATCTTATATCATGGGAAAAAAATTACA
ATTTAAATACAGCTACTGTTCTTCTTCAAC	TTATACTCAAATTGCGATATCGCAACAGAAAGGA
ATTTAAATACAGCTACTGTTCTTCTTCAAC	TTTTCATTTACTCCTGCAACAACAAACACTCTTTC
ATTTAAATACAGCTACTGTTCTTCTTCAAC	ATGCTGAAATCTGGTTGATTCCAGACGCAATATTGC
ATTTAAATACAGCTACTGTTCTTCTTCAAC	AATTAAGAAACTTCTTTACCTGCACTTTACCATGGA
ATTTAAATACAGCTACTGTTCTTCTTCAAC	GATAAAGATAACCGACAGCGTTGCAATACCGTTCGT
ATTTAAATACAGCTACTGTTCTTCTTCAAC	AGGACCTGGGTCAGAACAAAATCATCATCCGGTACC
ATTTAAATACAGCTACTGTTCTTCTTCAAC	ATCTTTTCCACCGGACCAACTTACCATATAGTGCA
ATTTAAATACAGCTACTGTTCTTCTTCAAC	CGGGTACCAGTACCCCTATACCGGTCATATCCTTAA
ATTTAAATACAGCTACTGTTCTTCTTCTAC	GAAGAAGGGAGGGGATGCCGATGGAGAAGGAGATTC
ATTTAAATACAGCTACTGTTCTTCTTCAAC	GTCTCAAGGTAAAATAACTGGCCGAAACAGGAAATT
ATTTAAATACAGCTACTGTTCTTCTTCAAC	AGGGAAATCAGCTGCGGGTATGAGTGCAGCTATGT
ATTTAAATACAGCTACTGTTCTTCTTCAAC	GCATTCTCCATGGCGGTTAGAAGGGTGGCTTCCGTG
ATTTAAATACAGCTACTGTTCTTCTTCAAC	ACTGCATGTCTGTCTTCTTAATCAATCCGATAGC
ATTTAAATACAGCTACTGTTCTTCTTCAAC	TGTATACCGGTGTCAATCAGGAAGGACAGACCTA
ATTTAAATACAGCTACTGTTCTTCTTCAAC	AGTTTGTCCATCTTGGTCTTTAACTCTAAAAGAGT
ATTTAAATACAGCTACTGTTCTTCTTCAAC	GCTATAACCGGATTCTTTATACGCATATGATATTGA
ATTTAAATACAGCTACTGTTCTTCTTCAAC	GATATTATGGCGACAAACAGGGAGCTGCCGGACA
ATTTAAATACAGCTACTGTTCTTCTTCAAC

>NZ_CP040506|2|1|3206892-3208870|PILER-CR
TTTAATACAGCTACTGTTCTTCTTCAACCC	ATGTCGACAACGCAGACCCATACGGCATCTAAT
TTAAATACAGCTACTGTTCTTCTTCAACTT	GCTCCTTTCACAATGCCTCCAAAAACCTTATCAT
TTAAATACAGCTACTGTTCTTCTTCAACTT	ATTGCTGCCAAGTCCAGCATACATCTCAAATGAT
TTAAATACAGCTACTGTTCTTCTTCAACCA	ATATCTCGCTTTTTGTTCTCATTTTGCTACCTCCAT
TTAAATACAGCTACTGTTCTTCTTCAACCC	ATAAGGTCCTGGAAACCATTTTTCTGTATGCAAAT
TTAAATACAGCTACTGTTCTTCTTCAACAA	AAATGGGGACGGCTTGGTGGTTGGCAATTATACAT
TTAAATACAGCTACTGTTCTTCTTCAACAG	GATATGAAATACAAAAATAAAGAGGGGTATTAAT
TTAAATACAGCTACTGTTCTTCTTCAACCA	TGGTCAAATGGCTCGGTAGAGGCTGCACCGTTAT
TTAAATACAGCTACTGTTCTTCTTCAACCT	TTGAAAACCGCTGTTTCCTCAAGTGACTGTTGAT
TTAAATACAGCTACTGTTCTTCTTCAACGA	ACAGACGGAGACCGGCGCCGATGAGGAGACTGGAT
TTAAATACAGCTACTGTTCTTCTTCAACAC	ATCCTCGACGAAGGAATACAAAACTTATCAAAGAAT
TTAAATACAGCTACTGTTCTTCTTCAACGT	TCCAAAGTTTCCACACATCCATCTTGCGTAGTTAT
TTAAATACAGCTACTGTTCTTCTTCAACTG	ATGACCCATCTTATATCATGGGAAAAAAATTACAAT
TTAAATACAGCTACTGTTCTTCTTCAACTT	ATACTCAAATTGCGATATCGCAACAGAAAGGAAT
TTAAATACAGCTACTGTTCTTCTTCAACTT	TTCATTTACTCCTGCAACAACAAACACTCTTTCAT
TTAAATACAGCTACTGTTCTTCTTCAACAT	GCTGAAATCTGGTTGATTCCAGACGCAATATTGCAT
TTAAATACAGCTACTGTTCTTCTTCAACAA	TTAAGAAACTTCTTTACCTGCACTTTACCATGGAAT
TTAAATACAGCTACTGTTCTTCTTCAACGA	TAAAGATAACCGACAGCGTTGCAATACCGTTCGTAT
TTAAATACAGCTACTGTTCTTCTTCAACAG	GACCTGGGTCAGAACAAAATCATCATCCGGTACCAT
TTAAATACAGCTACTGTTCTTCTTCAACAT	CTTTTCCACCGGACCAACTTACCATATAGTGCAAT
TTAAATACAGCTACTGTTCTTCTTCAACCG	GGTACCAGTACCCCTATACCGGTCATATCCTTAAAT
TTAAATACAGCTACTGTTCTTCTTCTACGA	AGAAGGGAGGGGATGCCGATGGAGAAGGAGATTCATTTA
AATACAGCTACTGTTCTTCTTCAACGTCTC	AAGGTAAAATAACTGGCCGAAACAGGAAATTATTTA
AATACAGCTACTGTTCTTCTTCAACAGGGA	AATCAGCTGCGGGTATGAGTGCAGCTATGTATTTA
AATACAGCTACTGTTCTTCTTCAACGCATT	CTCCATGGCGGTTAGAAGGGTGGCTTCCGTGATTTA
AATACAGCTACTGTTCTTCTTCAACACTGC	ATGTCTGTCTTCTTAATCAATCCGATAGCATTTA
AATACAGCTACTGTTCTTCTTCAACTGTAT	ACCGGTGTCAATCAGGAAGGACAGACCTAATTTA
AATACAGCTACTGTTCTTCTTCAACAGTTT	GTCCATCTTGGTCTTTAACTCTAAAAGAGTATTTA
AATACAGCTACTGTTCTTCTTCAACGCTAT	AACCGGATTCTTTATACGCATATGATATTGAATTTA
AATACAGCTACTGTTCTTCTTCAACGATAT	TATGGCGACAAACAGGGAGCTGCCGGACAATTTA
AATACAGCTACTGTTCTTCTTCAAC

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP040506.1\|WP_006782622.1\|3217601_3219017_-\|ATPase-AAA	unknown	unknown	gnl\|CDD\|225420
NZ_CP040506.1\|WP_034860056.1\|3213833_3214796_-\|type-I-CRISPR-associated-protein-Cas7	cas7b	pfam05107_cas7b_CAS-I-B:CAS-I-C	gnl\|CDD\|377458
NZ_CP040506.1\|WP_006782620.1\|3214788_3216528_-\|hypothetical-protein	cas8b1	mkCas0106_cas8b1_CAS-I-B	gnl\|CDD\|188234
NZ_CP040506.1\|WP_006782617.1\|3210484_3213031_-\|CRISPR-associated-helicase/endonuclease-Cas3	cas3	cd09639_cas3_CAS-I	gnl\|CDD\|350688
NZ_CP040506.1\|WP_034860053.1\|3203581_3203920_+\|helix-turn-helix-transcriptional-regulator	unknown	unknown	gnl\|CDD\|378971
NZ_CP040506.1\|WP_006782606.1\|3201967_3202345_-\|Hpt-domain-containing-protein	unknown	unknown	gnl\|CDD\|197502
NZ_CP040506.1\|WP_006782621.1\|3216540_3217239_-\|CRISPR-associated-endoribonuclease-Cas6	cas6	cd09652_cas6_CAS-I:CAS-III	gnl\|CDD\|273848
NZ_CP040506.1\|WP_006782614.1\|3209051_3209342_-\|CRISPR-associated-endonuclease-Cas2	cas2	cd09725_cas2_CAS-I:CAS-II:CAS-III:CAS-V	gnl\|CDD\|187856
NZ_CP040506.1\|WP_006782623.1\|3220075_3220450_-\|DUF3783-domain-containing-protein	unknown	unknown	gnl\|CDD\|378901
NZ_CP040506.1\|WP_034859970.1\|3195342_3197946_-\|hybrid-sensor-histidine-kinase/response-regulator	unknown	unknown	gnl\|CDD\|236848
NZ_CP040506.1\|WP_034859967.1\|3193857_3195330_-\|GntR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|153418
NZ_CP040506.1\|WP_138670220.1\|3220490_3221687_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|379260
NZ_CP040506.1\|WP_006782618.1\|3213106_3213832_-\|type-I-B-CRISPR-associated-protein-Cas5	cas5	cls001430_cas5_CAS-I-B	gnl\|CDD\|131641
NZ_CP040506.1\|WP_006782613.1\|3206536_3206749_+\|helix-turn-helix-transcriptional-regulator	unknown	unknown	gnl\|CDD\|379188
NZ_CP040506.1\|WP_034860055.1\|3209342_3210341_-\|type-I-B-CRISPR-associated-endonuclease-Cas1	cas1	cd09722_cas1_CAS-I-B	gnl\|CDD\|187853
NZ_CP040506.1\|WP_006782603.1\|3197959_3199903_-\|extracellular-solute-binding-protein	unknown	unknown	gnl\|CDD\|376948
NZ_CP040506.1\|WP_034859973.1\|3204670_3205987_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP040506.1\|WP_006782607.1\|3202562_3203438_-\|hypothetical-protein	unknown	unknown	unknown
NZ_CP040506.1\|WP_006782609.1\|3204047_3204260_+\|helix-turn-helix-transcriptional-regulator	unknown	unknown	gnl\|CDD\|379188
NZ_CP040506.1\|WP_006782612.1\|3206083_3206425_-\|hypothetical-protein	unknown	unknown	unknown

Protein	Function_ID	Function_description	E-value
NZ_CP040506.1\|WP_138670220.1\|3220490_3221687_-\|hypothetical-protein	gnl\|CDD\|379260	pfam13558, SbcCD_C, Putative exonuclease SbcCD, C subunit. Possible exonuclease SbcCD, C subunit, on AAA proteins.	1.58372e-25
NZ_CP040506.1\|WP_034860056.1\|3213833_3214796_-\|type-I-CRISPR-associated-protein-Cas7	gnl\|CDD\|377458	pfam05107, Cas_Cas7, CRISPR-associated protein Cas7. CRISPR-associated protein Cas7 is one of the components of the type I-B cascade-like antiviral defense complex. In Haloferax volcanii, Cas5, Cas6 and Cas7 form a small complex that aids the stability of CRISPR-derived RNA.	1.61351e-46
NZ_CP040506.1\|WP_006782620.1\|3214788_3216528_-\|hypothetical-protein	gnl\|CDD\|188234	TIGR02591, cas_Csh1, CRISPR-associated protein Cas8b/Csh1, subtype I-B/HMARI. This domain is found in the C-terminal 2/3 of a family of CRISPR associated proteins of the Hmari subtype. Except for the two sequences from halophilic archaea this domain contains a pair of CXXC motifs.	3.52767e-10
NZ_CP040506.1\|WP_006782617.1\|3210484_3213031_-\|CRISPR-associated-helicase/endonuclease-Cas3	gnl\|CDD\|350688	cd17930, DEXHc_cas3, DEXH/Q-box helicase domain of Cas3. CRISPR-associated (Cas) 3 is a nuclease-helicase responsible for degradation of dsDNA. The two enzymatic units of Cas3, a histidine-aspartate (HD) nuclease and a Superfamily 2 (SF2) helicase, may be expressed from separate genes as Cas3' (SF2 helicase) and Cas3'' (HD nuclease) or may be fused as a single HD-SF2 polypeptide. The nucleolytic activity of most Cas3 enzymes is transition metal ion-dependent. Cas3 is a member of the DEAD-like helicase superfamily, a diverse family of proteins involved in ATP-dependent RNA or DNA unwinding. This domain contains the ATP-binding region.	8.80112e-30
NZ_CP040506.1\|WP_034860053.1\|3203581_3203920_+\|helix-turn-helix-transcriptional-regulator	gnl\|CDD\|378971	pfam12844, HTH_19, Helix-turn-helix domain. Members of this family contains a DNA-binding helix-turn-helix domain. This family contains many example antitoxins from bacterial toxin-antitoxin systems. These antitoxins are likely to be DNA-binding domains.	1.25839e-10
NZ_CP040506.1\|WP_006782606.1\|3201967_3202345_-\|Hpt-domain-containing-protein	gnl\|CDD\|197502	smart00073, HPT, Histidine Phosphotransfer domain. Contains an active histidine residue that mediates phosphotransfer reactions. Domain detected only in eubacteria. This alignment is an extension to that shown in the Cell structure paper.	2.75591e-05
NZ_CP040506.1\|WP_034859970.1\|3195342_3197946_-\|hybrid-sensor-histidine-kinase/response-regulator	gnl\|CDD\|236848	PRK11107, PRK11107, hybrid sensory histidine kinase BarA; Provisional.	3.73829e-82
NZ_CP040506.1\|WP_006782623.1\|3220075_3220450_-\|DUF3783-domain-containing-protein	gnl\|CDD\|378901	pfam12646, DUF3783, Domain of unknown function (DUF3783). This presumed domain is functionally uncharacterized. This domain family is found in bacteria, archaea and eukaryotes, and is approximately 60 amino acids in length.	1.54468e-20
NZ_CP040506.1\|WP_006782614.1\|3209051_3209342_-\|CRISPR-associated-endonuclease-Cas2	gnl\|CDD\|187856	cd09725, Cas2_I_II_III, CRISPR/Cas system-associated protein Cas2. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas2 is present in majority of CRISPR/Cas systems along with Cas1; RNAse specific to U-rich regions; Possesses an RRM/ferredoxin fold.	2.36027e-25
NZ_CP040506.1\|WP_006782618.1\|3213106_3213832_-\|type-I-B-CRISPR-associated-protein-Cas5	gnl\|CDD\|131641	TIGR02592, hypothetical_protein_CTC_01466, CRISPR-associated protein Cas5, subtype I-B/HMARI. This is a CRISPR-associated protein unique to the hmari subtype of cas genes and CRISPR repeat, which is the only subtype present in Haloarcula marismortui ATCC 43049. The hmari type, though uncommon, is also found in the Aquificae, Thermotogae, Firmicutes, and Dictyoglomi.	1.3852e-50
NZ_CP040506.1\|WP_006782613.1\|3206536_3206749_+\|helix-turn-helix-transcriptional-regulator	gnl\|CDD\|379188	pfam13443, HTH_26, Cro/C1-type HTH DNA-binding domain. This is a helix-turn-helix domain that probably binds to DNA.	1.83194e-15
NZ_CP040506.1\|WP_034860055.1\|3209342_3210341_-\|type-I-B-CRISPR-associated-endonuclease-Cas1	gnl\|CDD\|187853	cd09722, Cas1_I-B, CRISPR/Cas system-associated protein Cas1. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas1 is the most universal CRISPR system protein thought to be involved in spacer integration; Cas1 is metal-dependent deoxyribonuclease, also binds RNA; Shown to possess a unique fold consisting of a N-terminal beta-strand domain and a C-terminal alpha-helical domain.	3.99299e-155
NZ_CP040506.1\|WP_006782603.1\|3197959_3199903_-\|extracellular-solute-binding-protein	gnl\|CDD\|376948	pfam02872, 5_nucleotid_C, 5'-nucleotidase, C-terminal domain.	1.59877e-42
NZ_CP040506.1\|WP_006782609.1\|3204047_3204260_+\|helix-turn-helix-transcriptional-regulator	gnl\|CDD\|379188	pfam13443, HTH_26, Cro/C1-type HTH DNA-binding domain. This is a helix-turn-helix domain that probably binds to DNA.	6.03485e-13
NZ_CP040506.1\|WP_006782622.1\|3217601_3219017_-\|ATPase-AAA	gnl\|CDD\|225420	COG2865, COG2865, Predicted transcriptional regulator containing an HTH domain and an uncharacterized domain shared with the mammalian protein Schlafen [Transcription].	1.47536e-79
NZ_CP040506.1\|WP_034859967.1\|3193857_3195330_-\|GntR-family-transcriptional-regulator	gnl\|CDD\|153418	cd07377, WHTH_GntR, Winged helix-turn-helix (WHTH) DNA-binding domain of the GntR family of transcriptional regulators. This CD represents the winged HTH DNA-binding domain of the GntR (named after the gluconate operon repressor in Bacillus subtilis) family of bacterial transcriptional regulators and their putative homologs found in eukaryota and archaea. The GntR family has over 6000 members distributed among almost all bacterial species, which is comprised of FadR, HutC, MocR, YtrA, AraR, PlmA, and other subfamilies for the regulation of the most varied biological process. The monomeric proteins of the GntR family are characterized by two function domains: a small highly conserved winged helix-turn-helix prokaryotic DNA binding domain in the N-terminus, and a very diverse regulatory ligand-binding domain in the C-terminus for effector-binding/oligomerization, which provides the basis for the subfamily classifications. Binding of the effector to GntR-like transcriptional regulators is presumed to result in a conformational change that regulates the DNA-binding affinity of the repressor. The GntR-like proteins bind as dimers, where each monomer recognizes a half-site of 2-fold symmetric DNA sequences.	1.61693e-15
NZ_CP040506.1\|WP_006782621.1\|3216540_3217239_-\|CRISPR-associated-endoribonuclease-Cas6	gnl\|CDD\|273848	TIGR01877, CRISPR-associated_endoribonuclease_Cas6_1, CRISPR-associated endoribonuclease Cas6. CRISPR is a term for Clustered, Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This broadly distributed, highly divergent Cas family is now characterized as an endoribonuclease that generates guide RNAs for host defense against phage and other invaders. The family contains a C-terminal motif GXGXXXXXGXG, where the each X between two Gly is hydrophobic and the spacer XXXXX contains (usually) one Arg or Lys. The seed alignment for the current version of this model has gappy columns removed. Members of this protein family are found associated with several different CRISPR/cas system subtypes, and consequently we designate this family Cas6.	1.0972e-15

>NZ_CP040506.1|WP_006782613.1|3206536_3206749_+|helix-turn-helix-transcriptional-regulator
MIKYDPLWETMKKRNISQYKLIKDYGIDKAQLQRLRKNEVVKTIILNKLCEILDCRIEEILVYEPDITEE
>NZ_CP040506.1|WP_006782612.1|3206083_3206425_-|hypothetical-protein
MDKVRVESKNTDSYRFKERVYRLMNGTYDLDIYSVGEMNTVETEFSDGKYCEELYKDIFEANCRICERLGEEEDKDVEIIIHNYNLMTEYLCMKMFDYGVLFCKREIAKTVVV
>NZ_CP040506.1|WP_034859973.1|3204670_3205987_+|hypothetical-protein
MEKEMKNLRKIVSLMAAVCMLLSIWQPMTAKAAEGKLVVEGNVTLSGGNGNMEDVLITIKHGYMTDGPVVGTGHPDANGHYAIETTVSSMGFLALIVTPSLPGYDNYSPSSNIYPGQNTADLLLVANGSPTTYGVSGTITMNGAALPSNLCPIVDFEVPATTTKKELQACGGNYFCNGLAGNKVIITPHLDGYTFTPESITIEKIDRVYDDANFVMTPNGTAETPVAPETPDTPDAPALPENTESTEAAKNTVTLYFMTGSSPADPGEVFEQFEVAKNSRGNTTTLAKTIKSRTPVKDGYKFNYWQEGKLSDPTVLGNRINTVIWTNDTDQYIYAQYTKIEEPPTSDNTGNTVTLYFMTGSSPSDPGEVFEQFEVAKNSRGNTTTLAKTIKSRTPQKDGLKFNYWQEAKLSDPTVLGNRLYTVIWTNDTDQYIYAQYK
>NZ_CP040506.1|WP_006782609.1|3204047_3204260_+|helix-turn-helix-transcriptional-regulator
MITYDKLWETMDKKGITKYKLVNDYGISKSMINRLNHNMGINTNTINNLCSILNCNVEDILTFCPDEEKA
>NZ_CP040506.1|WP_034860053.1|3203581_3203920_+|helix-turn-helix-transcriptional-regulator
MDNERKTLGKRINQTRKDRGITADKLSELCNINATYLRQIEGSGKTPSLPVFISICNSLKVSANYLLQDELDVSEISDIEELETLWETAEPSQYELVVSMLKAAIAHIKGEE
>NZ_CP040506.1|WP_006782607.1|3202562_3203438_-|hypothetical-protein
MKKLWDNIQKGYGNFWRDDRCDWNQSHLSQADKRSLWYGAVLLCALTVLFTELLYSYHFGKIERQNEKNIEMALNRITAYAASATDDEYEAIARTIRQDLIYSDFSRDKENYIRYIPNTAQICRLYPQTFPNQVYLLCNNTGMLYGLDIFEDDAAVSGATQASGDTQVSADTQFSGGTKVSGGYDDISEATLLITKMPGNKTGHARLDRTRGILSIQKMKSLFCDDCIRDIMAALDEYGTMNEFVIMDGKEKKFYPIKEGVLDIGDYHLELTYKDNGYDIAIQYSPVQQSR
>NZ_CP040506.1|WP_006782606.1|3201967_3202345_-|Hpt-domain-containing-protein
MTLKEAYEKLGGDYADTTCRIGEDMLLRLIGILLKDSNYTDICTSLKQQDYEAAFRAAHTLKGVTLNLGLSSLADKTAKLVETLRSVQDTNDIHLAFTDFDSAYRDMDTVFSELLASLALGGVKQ
>NZ_CP040506.1|WP_006782603.1|3197959_3199903_-|extracellular-solute-binding-protein
MSRGLKKCVRLILYTTMMSCILTGCGKQAPKEKIVVEILYNNHFKQVEKLVESTYDDIDLRIEISPYSSEELRRLERGVGPELVIAAQPDSDMVQKYLLDLSDTRASSAYDGTIMSDLKQDGKTYLIPLPGVYSGYVVNETMFEQAGISMPTSNTELVEALAKLKEKGLGVGEDHTNFSMRSDYNAEVGMFYVGCMIPDFLGTVEGVQWLADFKEKKAMFTGVWEESFVLPDELVNAGIMDPAAIARQRNSILCEQRLSNGTLAAAFGDSSLYYACVEQNQKEVLKGTAEAYSYRMLPLLGSEGNHPWFMFAPSALMGVNNAISEEKQEACKRIVDLLSTPEGQAALIQDMGPGISCLLEYQQQEDWIPAGVEEYIESGYIYNVLFPSKTIEYLGGCVRDVMAGKCTVEEALQDIDNYYYEGTGKSEYDFTVIGEMAHDLLMENFNTRREETEIGNFVADCVAEVSGAPIAVVNGGGIRASFYQGVVYGGDTAAVCPFDNRIIVVEMDGQTVWDMLENGLSTCTEEFPGGQFLQISGLHYTFDSSKPAGSRLVSVTWPDGTVLERSERFQVAVNDYMAGINSYAEGNGDGYTMLNCYDEETPKGSVSLVNEMEYYYRDAMALYFEEHRDEAVDVQLEGRIRDLAKEQ
>NZ_CP040506.1|WP_034859970.1|3195342_3197946_-|hybrid-sensor-histidine-kinase/response-regulator
MRRRQSLNIKQKEQREFITLRFASALILMTAILGVFAFVVYQNEAEKTVTNISSVYLEEMTTQISSHFQTNLDSQFSQIRTIAGAITEADLEQEASLQDFLEQAQEDNGFAHIAMISAKGIAYSPEGTTPVMSKISVLDKLLSGTEELVSVNETIWESNMILLGVPIPPVSFQGEKLTAVIIGIPTAEIGAKLGMESEKETNSYTNIVTRDGDFVIKSTFSNDGLYGSNLFSIYEKQAVFDKGYDMESFHADIQAGKCGMTLLTVGTHHEYLYYVPISGTNWYMVTSMAYETVNDKILYLSRFMVLVGLGIFSVVLLIIILFFLALRRIETRNQELLLVEKERAEAANRAKSDFLSQMSHEIRTPLNGIIGMTEVGRQHIGEPDRISHCFDKIILSSQHLLALINDILDMAKIESGKIELHLEKFDLGQLLQSLTTVFYVQAKHKKIDYEIYLRGELEEFLVGDALRLNQILTNLLSNAMKFTPEKGRVSLMIEELRRDEETIWLRFEVSDTGRGITPENLERVFETFTQENSGIARQYGGTGLGLPITKNFVEMMGGTITVTSEAGSGSIFRVDLPFGRIQEGEEEAFGYHQSVLVVNKDVELETHLANVLKRAGFTVYTVETEGGEPDMIPEKVKGNAPYDLCFLEWGCCDDIKRLAGVIRQESQNEALHIIITGYDQDELDDTASLCGADGTLCQPAFLVDIVQLMKRLEGETQTPVETENSAILRDAKVLVVEDNEINLYIAVELLQHTGAEVSTAKNGQEAVEKFAASPEGYYDLILMDVQMPVMDGYRATNTIRQLSRKDAGSVIIIAMTANSFYEDIRKCMDSGMNAHIAKPFVMEDVISTYTDVLTAEGKEGYDSTKNE
>NZ_CP040506.1|WP_034859967.1|3193857_3195330_-|GntR-family-transcriptional-regulator
MILKYDGMMYERVFQILKYKIESGLLPAGTSLPSRSDLCQELGTSEKTVRRALTMLEEAGLIETRQRKRPVVCAGRDEVHLTTRLALEKIDADITSDVLKTGVLLCYPIIKNGIALCEPEDLYIPRKIVEHMNIEDGEEFWKLSKRLWRFFVARNENDLSLQVVESLGLSDLKPLQDDRTVRARFYEQLKEFMRALEHGEAPESVHFDDMSGIYGLAEGERPAFRAAPDSAVLLGRKQLEKLLAGAEVRYSAVYMDILGLIAAERYRPGDKLPSHKELQTIYGVSVDTTIKAIQILQDWGVVRTVRGNGIFVEMDREELEKIQVPAHLIAYHVRRYLDSLELLALTIEGAAACAAPRITEQAIQEAKAEIIRQWEEEYLYERTPAILLKLITEHVGIDALNAIYMLLQRNFRIGRSIPGLLNTSKTPVNCEIHEKCVDVIELLSAGNQEAFSEKASLLFEDIYRLVIEECKRLGFYEAAVEIYDGSALWK
>NZ_CP040506.1|WP_006782614.1|3209051_3209342_-|CRISPR-associated-endonuclease-Cas2
MGKSMNYNYAFVFYDVGEKRVQKVFKICKKYLSHFQYSVFRGEMTPSKLISLRSDLKKVIDTKEDFVCIIKLMNDNVFGEEILGEANGLTGEELIL
>NZ_CP040506.1|WP_034860055.1|3209342_3210341_-|type-I-B-CRISPR-associated-endonuclease-Cas1
MGSTRYIMSMGELSRKDNSLCFRKDGKNVYIPIENTKEIYCLSEVSFNTKLLDFLAKNHVVVHFFNYYEGYSGSFYPRDQYNSGKLVIKQAETFRNSRMQVAKAIVLGIGQNMDEVLHHYYKHEKKEVKETIDWLRKEFKERVQKAEQVNELMSIEGEAWMRFYGDFKYFLPEDFVMNKRVKRPPDNPINAMISFGNTLLYVKTISSIYRTHLDQRISFLHEPSEGRFSLSLDMSEVFKPVIVYRTIFDLVNNRKIQVEKHFDKKVNYCLLNEEGRKIFIEAFEGRMESVFVHAGLKRKVSYRTAIKLDCYKLIKMILEGREFVPFSLKEGK
>NZ_CP040506.1|WP_006782617.1|3210484_3213031_-|CRISPR-associated-helicase/endonuclease-Cas3
MQLNDVLNFEEPIYAHICEGKNAETLQQHTKLCQKYYKKLMDTKMLKLILGRFLQRYMENCTKEAELFFWEMLEGSIIFHDTGKINPAFQRERMKKPFKYQKDFQILEGSKHSLLSSVIYLDYCYYLLAQMTMSIDEKRKLKSLIYVNAYIISRHHDDLGAMREYGEKFLEGGQIYEMISRLPNEKQTLYKGPFHFNQENIGTVCKAFPGGGKKRESREDDRKGGMELYIYARLLYSLLTSADYYATTEYMNGFAINQFGEVNQVDELRRVYEACGVLKSIREYEKTNVGTKFVAENEINALRCQLFLEAEAEWKVHKEENVFFLEAPTGSGKSNTAMNLSFQMLKAGQTKLCYVYPFNTLVEQNLDSIKRIFGGNEDIMSMVTVVNSVTPIKIDEDKKKAMSENNSEFYQSALLDRQFLNYPFILTTHVGLFETLFSNKREALFGFLQMAGSVIVLDEIQSYKNTLWSEIIIFLKAFAEFMNMKVLIMSATLPDLEYLTEESGQVVRLMKRRDQYFLNPVFRERVQLSYEMLKEKTDFEQLHHHICDHVQQEKKVLVEFIKKKSAYEFYEYACEYGILGMELRLLTGDDNRLDREKILNEIRCSDKGVILIATQVVEAGVDIDMDIGYKDISKLDSEEQFLGRINRSCKKGGVTYFFDLDNAGDIYKDDFRINRELTLENEEMREALKNKQFAEYYLSVINLLKESRNKSASEEGLEHFFKEVKHGNFKEIAAHMHLIEENSWTMSVYLSRMIELPDGTQLDGEVCWEEYKKLLLNQELPYAKKQVLLSKVRSQMNYFIYEIKKNSNLVYSDRIGELYMIQNGDRYFENGKLNKQALEEAGGMFIEL
>NZ_CP040506.1|WP_006782618.1|3213106_3213832_-|type-I-B-CRISPR-associated-protein-Cas5
MEILKFTLKGKNAFFKMPEVNTYYYFTYGNIHKVALLGIFGAILGYNGYAQMTEEDQYPEFYERLKDISISIVPQKGSKGYIPKKVQSFNNSVGYASQEQGGNLIVKQQWLENPCWEVYVKIDSSEAEAIKKAIMNHTCVYVPYLGSNDHPADICDAEVLTGEFINDEEIAYIDSLFPAAKVELDYEDDDVTPYKYSEYLPIALDEHSLMYCMEKFYVTNIPVLCHECDVCRVGGKNIVFY
>NZ_CP040506.1|WP_034860056.1|3213833_3214796_-|type-I-CRISPR-associated-protein-Cas7
MNKRVYGVLGISSIMANWNADFSGYPKTTSDGQTYGSDKALKYPMKKMWENEGKPVIYIKSMCFEEGKKGEVNLIPRTLKERYEQVFGVELKKGGDVREVLKKLFQAVDIKNFGATFAEAGNNISITGAVQIGQGFNKYDGTEPQEQPILSPFRDPKAKEKSKKSEGDEGEEAKNSTLGTKIVSNEAHYFYPFSINPLAYKGYMELGVTEGYLESDYEMFKKAALTSATSFATNSKAGCENEFALFVETKEDFYLPTLTEYIEFEKGDVNTITITCADLFEQVKDKILSVEIYYNPYTTKIDPEKINGAKYYNILTQKEV
>NZ_CP040506.1|WP_006782620.1|3214788_3216528_-|hypothetical-protein
MIQDCLEIFKYKLDKYDDERLVLDNYVPKDGTYILIEMSEPQWNVKDTVAIRFNKKDGKLEGKTSSNYRLISTLDYYSKLIAMNKPVDPQKVIHSNNYLSFAVKKESIATGKLSSEVLDLYYEILKNPIQKYSKPNVRKLYEETEKMCGEVDRILAEQIHQWVRENLSKLEIDTSKKDYLKLYFIFPDEAKTKELYRKEGSRYTIPNIYNNNDFNCLINDEIYGLPNDNMGMNSKKVFLANKSKRVQVPYLLNREQVMLQAKFYDFLYGQASKGNLNIYFDENRKEIIPLKNGESPTADMSGYFIRLKKGMEAEIHNVDAVPCYNPHLQTTFFYQQYLETDQSDNYGMITDRKRLELLIDDVLFGKSLISNYFTDVGDITIKDGTLVQNLIMSRELLFSWFYKNDGVNPWPVLQKCSKTMIYNSINKGYWKKTRHQINLLWSLKDYFKKEEIMYPVVESLRKHINEKDDWMFDNDEEYYFAIGQMVSYFINKSKAAKKPLSFINPFLNAKDDDMIKSHLEVLFKKYDYDIMYMDLRVKRLFSNVMIHKPVEKIDTTMIAAGVAANNLIFEKKEAERNDE
>NZ_CP040506.1|WP_006782621.1|3216540_3217239_-|CRISPR-associated-endoribonuclease-Cas6
MHYVFEIRIKIFTLQSISKEDSYAAVTDFIDGVLIENEVWEQMHNENCYKQYCFNGLYPIEKEGIYKREQVYQFIVRSTNKDLIEYLSYNLPKHENNLMKGLTCENRMISKKHITSLYSITPVIVKGKNNGYWRDDMTFEDFEQRLKVNLIKKYNELEHTKLDENFELHTLLEFKNYGPIPVPYKNVKLLADKIELKIADNETAQALAYMALGTGICEMNSRGMGFVNCHYV
>NZ_CP040506.1|WP_006782622.1|3217601_3219017_-|ATPase-AAA
MIEKLIAEATECDFKVALETRRPKSWLKSVSAFANGIGGTLFFGIDNEGKITGIEDIQSDAEAISRFIKERITPLPQFVLTPVREGDKDILLLSIAAGRTTPYYYKADGIMEAYIRVGNESVVAPDYVVNELILKGSNRSFDTLLTDARKEDYSFTLLEATYRERTGVRLETSDYFSFGLTNREGVLTNAGKLLADQYIVYNSRVFCTRWNGLEKGSIFDDALDDKEYEGNLIYLLQSSCDFVRNNSKVRFVKEARYRIDKPDYADRAVMEALVNALIHRDYIVAGSEIHVDMYDDRLEIQSPGGMFEGRPIQECDIDSIGSVRRNPVIADLFHRMKYMERRGSGLKKILSETRKLPGYTEQLKPEFFSTPSDFRVVLKNINYNMEEDTIQDTIQDTIQDTIQDKSKRMKEIIAYCKEARTREEIQSYIGIVNRAHFRRAYLKPLLKTGMLEMTLPEKPSSRNQKYISSHK
>NZ_CP040506.1|WP_006782623.1|3220075_3220450_-|DUF3783-domain-containing-protein
MREMVLYYNTVQNPNVAKLKGVLVRMGVRIKNITPEQVTQTVGYLAGIEGYPESEIPEVLPVIEEEMLVMRGFTSRRMDELLMNLRKAGVPKIALKAVVTESNCGWSFYHLYEEIREEHKKMSL
>NZ_CP040506.1|WP_138670220.1|3220490_3221687_-|hypothetical-protein
MAGAGNDEMLTEDKRAGAGSTGAVGMLAVAAAAEESLRAELEKRSNPRYDLMGNEYGAKLQKAIEKKDEEKQKLTDLRGEYLRVYLNRSFSLSSDDNSEYEKLLEKLSCDRLEEYRKSAAEQARSAVEHFKDDFMYKIRSAIREALIRKDELNRVISGLDFGKDKYQFYIGKNKGPDGQYYDMFMADSLEINPAQLDVSMDNQLDFFTMEHENHYGQMVNDLINVFIPPDNATPEELEEAKRNMDKYADYRTYLSFDMQQLVQNEDETIKIRLSKMIKKNSGGEGQNPLYVALLASFAQAYRINLKPKVQRNPTIRLVVLDEAFSKMDAEKVASCIQLIRGLGFQALISATNDKIQNYVETVDKIFVFANPNKKCISIQEFEREEFGELKADLVDGEG

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP040506_3

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP040506_3

3219152-3219837

TypeI-B

Consensus_repeat	Method
ATTTAAATACAGCTACTGTTCTTCTTCA	PILER-CR
ATTTAAATACAGCTACTGTTCTTCTTCAAC	CRISPRCasFinder
ATTTAAATACAGCTACTGTTCTTCTTCA	CRT

10 spacers

cas6,cas8b1,cas7b,cas5,cas3,cas1,cas2

The CRISPR arrays of NZ_CP040506_3

>merge|NZ_CP040506|3|3219152-3219837|PILER-CR,CRISPRCasFinder,CRT
ATTTAAATACAGCTACTGTTCTTCTTCACTAATGTCCATGCCCTTGTATATCTTGCAAAAATTTAATTTAAATACAGCTTCTGTTCTTCTTCACCCTCCGGATGGCCGCCCTGTCTCCTCCAGGGCCTATAATTTAAATACAGCTTCTGTTCTTCTTCAACGTACATCCACTGTCAACGGGCATCTACGGGCCATGAAATTTAAATACAGCTACTGTTCTTCTTCAACCGCGACGCCCATGGGACTGTCCGGGTCCATGTTGTATTTAAATACAGCTACTATTCTTCTTCAACCATACAACCTATTTCCCAGGCATCTCCACAGCAGAATTTAAATACAGCTACTGTTCTTCTTCAACCCATCAGAGTGATACTCAATCTGCACCTTACCAGCATTTAAATACAGCTACTGTTCTTCTTCAACGGATTGATTGTTCTGGTGGTGCTTTTAGCATTTCATTTAAATACTGCTACTGTTCTTCTTCAACTGCAAGTTGTTTCGCTTTGTAATCATCAATCAATATCATTTAAATACAGCTACTGTTCTTCTTCACCGGAAGGCGCTCACCTGTATTGCGGTATACAACCTCCATTTAAATACAGCTTCTGTTCTTCTTCACCTAGCCGACTATTTTAATGTTACTGTCGATTTCTTAAATTTAAATACAGCTACTGTTCTTCTTCACC

>NZ_CP040506|3|2|3219152-3219835|PILER-CR
ATTTAAATACAGCTACTGTTCTTCTTCA	CTAATGTCCATGCCCTTGTATATCTTGCAAAAATTTA
ATTTAAATACAGCTTCTGTTCTTCTTCA	CCCTCCGGATGGCCGCCCTGTCTCCTCCAGGGCCTATA
ATTTAAATACAGCTTCTGTTCTTCTTCA	ACGTACATCCACTGTCAACGGGCATCTACGGGCCATGAA
ATTTAAATACAGCTACTGTTCTTCTTCA	ACCGCGACGCCCATGGGACTGTCCGGGTCCATGTTGT
ATTTAAATACAGCTACTATTCTTCTTCA	ACCATACAACCTATTTCCCAGGCATCTCCACAGCAGA
ATTTAAATACAGCTACTGTTCTTCTTCA	ACCCATCAGAGTGATACTCAATCTGCACCTTACCAGC
ATTTAAATACAGCTACTGTTCTTCTTCA	ACGGATTGATTGTTCTGGTGGTGCTTTTAGCATTTC
ATTTAAATACTGCTACTGTTCTTCTTCA	ACTGCAAGTTGTTTCGCTTTGTAATCATCAATCAATATC
ATTTAAATACAGCTACTGTTCTTCTTCA	CCGGAAGGCGCTCACCTGTATTGCGGTATACAACCTCC
ATTTAAATACAGCTTCTGTTCTTCTTCA	CCTAGCCGACTATTTTAATGTTACTGTCGATTTCTTAA
ATTTAAATACAGCTACTGTTCTTCTTCA

>NZ_CP040506|3|3|3219152-3219837|CRISPRCasFinder
ATTTAAATACAGCTACTGTTCTTCTTCACT	AATGTCCATGCCCTTGTATATCTTGCAAAAATTTA
ATTTAAATACAGCTTCTGTTCTTCTTCACC	CTCCGGATGGCCGCCCTGTCTCCTCCAGGGCCTATA
ATTTAAATACAGCTTCTGTTCTTCTTCAAC	GTACATCCACTGTCAACGGGCATCTACGGGCCATGAA
ATTTAAATACAGCTACTGTTCTTCTTCAAC	CGCGACGCCCATGGGACTGTCCGGGTCCATGTTGT
ATTTAAATACAGCTACTATTCTTCTTCAAC	CATACAACCTATTTCCCAGGCATCTCCACAGCAGA
ATTTAAATACAGCTACTGTTCTTCTTCAAC	CCATCAGAGTGATACTCAATCTGCACCTTACCAGC
ATTTAAATACAGCTACTGTTCTTCTTCAAC	GGATTGATTGTTCTGGTGGTGCTTTTAGCATTTC
ATTTAAATACTGCTACTGTTCTTCTTCAAC	TGCAAGTTGTTTCGCTTTGTAATCATCAATCAATATC
ATTTAAATACAGCTACTGTTCTTCTTCACC	GGAAGGCGCTCACCTGTATTGCGGTATACAACCTCC
ATTTAAATACAGCTTCTGTTCTTCTTCACC	TAGCCGACTATTTTAATGTTACTGTCGATTTCTTAA
ATTTAAATACAGCTACTGTTCTTCTTCACC

>NZ_CP040506|3|2|3219152-3219835|CRT
ATTTAAATACAGCTACTGTTCTTCTTCA	CTAATGTCCATGCCCTTGTATATCTTGCAAAAATTTA
ATTTAAATACAGCTTCTGTTCTTCTTCA	CCCTCCGGATGGCCGCCCTGTCTCCTCCAGGGCCTATA
ATTTAAATACAGCTTCTGTTCTTCTTCA	ACGTACATCCACTGTCAACGGGCATCTACGGGCCATGAA
ATTTAAATACAGCTACTGTTCTTCTTCA	ACCGCGACGCCCATGGGACTGTCCGGGTCCATGTTGT
ATTTAAATACAGCTACTATTCTTCTTCA	ACCATACAACCTATTTCCCAGGCATCTCCACAGCAGA
ATTTAAATACAGCTACTGTTCTTCTTCA	ACCCATCAGAGTGATACTCAATCTGCACCTTACCAGC
ATTTAAATACAGCTACTGTTCTTCTTCA	ACGGATTGATTGTTCTGGTGGTGCTTTTAGCATTTC
ATTTAAATACTGCTACTGTTCTTCTTCA	ACTGCAAGTTGTTTCGCTTTGTAATCATCAATCAATATC
ATTTAAATACAGCTACTGTTCTTCTTCA	CCGGAAGGCGCTCACCTGTATTGCGGTATACAACCTCC
ATTTAAATACAGCTTCTGTTCTTCTTCA	CCTAGCCGACTATTTTAATGTTACTGTCGATTTCTTAA
ATTTAAATACAGCTACTGTTCTTCTTCA

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP040506.1\|WP_138670220.1\|3220490_3221687_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|379260
NZ_CP040506.1\|WP_006782623.1\|3220075_3220450_-\|DUF3783-domain-containing-protein	unknown	unknown	gnl\|CDD\|378901
NZ_CP040506.1\|WP_006782628.1\|3226429_3227065_-\|endonuclease-III	unknown	unknown	gnl\|CDD\|223255
NZ_CP040506.1\|WP_034860056.1\|3213833_3214796_-\|type-I-CRISPR-associated-protein-Cas7	cas7b	pfam05107_cas7b_CAS-I-B:CAS-I-C	gnl\|CDD\|377458
NZ_CP040506.1\|WP_006782626.1\|3224633_3226013_-\|hypothetical-protein	unknown	unknown	unknown
NZ_CP040506.1\|WP_006782621.1\|3216540_3217239_-\|CRISPR-associated-endoribonuclease-Cas6	cas6	cd09652_cas6_CAS-I:CAS-III	gnl\|CDD\|273848
NZ_CP040506.1\|WP_006782625.1\|3224013_3224637_-\|DUF4194-domain-containing-protein	unknown	unknown	gnl\|CDD\|372745
NZ_CP040506.1\|WP_006782614.1\|3209051_3209342_-\|CRISPR-associated-endonuclease-Cas2	cas2	cd09725_cas2_CAS-I:CAS-II:CAS-III:CAS-V	gnl\|CDD\|187856
NZ_CP040506.1\|WP_006782629.1\|3227143_3228052_-\|FtsX-like-permease-family-protein	unknown	unknown	gnl\|CDD\|225088
NZ_CP040506.1\|WP_006782632.1\|3229909_3230689_-\|flagellar-biosynthetic-protein-FliR	unknown	unknown	gnl\|CDD\|376520
NZ_CP040506.1\|WP_006782620.1\|3214788_3216528_-\|hypothetical-protein	cas8b1	mkCas0106_cas8b1_CAS-I-B	gnl\|CDD\|188234
NZ_CP040506.1\|WP_006782630.1\|3228041_3228737_-\|ATP-binding-cassette-domain-containing-protein	unknown	unknown	gnl\|CDD\|225438
NZ_CP040506.1\|WP_006782618.1\|3213106_3213832_-\|type-I-B-CRISPR-associated-protein-Cas5	cas5	cls001430_cas5_CAS-I-B	gnl\|CDD\|131641
NZ_CP040506.1\|WP_006782617.1\|3210484_3213031_-\|CRISPR-associated-helicase/endonuclease-Cas3	cas3	cd09639_cas3_CAS-I	gnl\|CDD\|350688
NZ_CP040506.1\|WP_034860055.1\|3209342_3210341_-\|type-I-B-CRISPR-associated-endonuclease-Cas1	cas1	cd09722_cas1_CAS-I-B	gnl\|CDD\|187853
NZ_CP040506.1\|WP_006782631.1\|3228765_3229830_-\|flagellar-biosynthesis-protein-FlhB	unknown	unknown	gnl\|CDD\|376521
NZ_CP040506.1\|WP_006782622.1\|3217601_3219017_-\|ATPase-AAA	unknown	unknown	gnl\|CDD\|225420
NZ_CP040506.1\|WP_006782613.1\|3206536_3206749_+\|helix-turn-helix-transcriptional-regulator	unknown	unknown	gnl\|CDD\|379188
NZ_CP040506.1\|WP_006782627.1\|3226169_3226424_-\|TfoX/Sxy-family-protein	unknown	unknown	gnl\|CDD\|377439
NZ_CP040506.1\|WP_006782612.1\|3206083_3206425_-\|hypothetical-protein	unknown	unknown	unknown

Protein	Function_ID	Function_description	E-value
NZ_CP040506.1\|WP_138670220.1\|3220490_3221687_-\|hypothetical-protein	gnl\|CDD\|379260	pfam13558, SbcCD_C, Putative exonuclease SbcCD, C subunit. Possible exonuclease SbcCD, C subunit, on AAA proteins.	1.58372e-25
NZ_CP040506.1\|WP_006782623.1\|3220075_3220450_-\|DUF3783-domain-containing-protein	gnl\|CDD\|378901	pfam12646, DUF3783, Domain of unknown function (DUF3783). This presumed domain is functionally uncharacterized. This domain family is found in bacteria, archaea and eukaryotes, and is approximately 60 amino acids in length.	1.54468e-20
NZ_CP040506.1\|WP_006782628.1\|3226429_3227065_-\|endonuclease-III	gnl\|CDD\|223255	COG0177, Nth, Predicted EndoIII-related endonuclease [DNA replication, recombination, and repair].	4.44012e-80
NZ_CP040506.1\|WP_034860056.1\|3213833_3214796_-\|type-I-CRISPR-associated-protein-Cas7	gnl\|CDD\|377458	pfam05107, Cas_Cas7, CRISPR-associated protein Cas7. CRISPR-associated protein Cas7 is one of the components of the type I-B cascade-like antiviral defense complex. In Haloferax volcanii, Cas5, Cas6 and Cas7 form a small complex that aids the stability of CRISPR-derived RNA.	1.61351e-46
NZ_CP040506.1\|WP_006782621.1\|3216540_3217239_-\|CRISPR-associated-endoribonuclease-Cas6	gnl\|CDD\|273848	TIGR01877, CRISPR-associated_endoribonuclease_Cas6_1, CRISPR-associated endoribonuclease Cas6. CRISPR is a term for Clustered, Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This broadly distributed, highly divergent Cas family is now characterized as an endoribonuclease that generates guide RNAs for host defense against phage and other invaders. The family contains a C-terminal motif GXGXXXXXGXG, where the each X between two Gly is hydrophobic and the spacer XXXXX contains (usually) one Arg or Lys. The seed alignment for the current version of this model has gappy columns removed. Members of this protein family are found associated with several different CRISPR/cas system subtypes, and consequently we designate this family Cas6.	1.0972e-15
NZ_CP040506.1\|WP_006782629.1\|3227143_3228052_-\|FtsX-like-permease-family-protein	gnl\|CDD\|225088	COG2177, FtsX, Cell division protein [Cell division and chromosome partitioning].	4.66379e-38
NZ_CP040506.1\|WP_006782614.1\|3209051_3209342_-\|CRISPR-associated-endonuclease-Cas2	gnl\|CDD\|187856	cd09725, Cas2_I_II_III, CRISPR/Cas system-associated protein Cas2. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas2 is present in majority of CRISPR/Cas systems along with Cas1; RNAse specific to U-rich regions; Possesses an RRM/ferredoxin fold.	2.36027e-25
NZ_CP040506.1\|WP_006782632.1\|3229909_3230689_-\|flagellar-biosynthetic-protein-FliR	gnl\|CDD\|376520	pfam01311, Bac_export_1, Bacterial export proteins, family 1. This family includes the following members; FliR, MopE, SsaT, YopT, Hrp, HrcT and SpaR All of these members export proteins, that do not possess signal peptides, through the membrane. Although the proteins that these exporters move may be different, the exporters are thought to function in similar ways.	1.13653e-40
NZ_CP040506.1\|WP_006782620.1\|3214788_3216528_-\|hypothetical-protein	gnl\|CDD\|188234	TIGR02591, cas_Csh1, CRISPR-associated protein Cas8b/Csh1, subtype I-B/HMARI. This domain is found in the C-terminal 2/3 of a family of CRISPR associated proteins of the Hmari subtype. Except for the two sequences from halophilic archaea this domain contains a pair of CXXC motifs.	3.52767e-10
NZ_CP040506.1\|WP_006782630.1\|3228041_3228737_-\|ATP-binding-cassette-domain-containing-protein	gnl\|CDD\|225438	COG2884, FtsE, Predicted ATPase involved in cell division [Cell division and chromosome partitioning].	2.856e-101
NZ_CP040506.1\|WP_006782618.1\|3213106_3213832_-\|type-I-B-CRISPR-associated-protein-Cas5	gnl\|CDD\|131641	TIGR02592, hypothetical_protein_CTC_01466, CRISPR-associated protein Cas5, subtype I-B/HMARI. This is a CRISPR-associated protein unique to the hmari subtype of cas genes and CRISPR repeat, which is the only subtype present in Haloarcula marismortui ATCC 43049. The hmari type, though uncommon, is also found in the Aquificae, Thermotogae, Firmicutes, and Dictyoglomi.	1.3852e-50
NZ_CP040506.1\|WP_006782617.1\|3210484_3213031_-\|CRISPR-associated-helicase/endonuclease-Cas3	gnl\|CDD\|350688	cd17930, DEXHc_cas3, DEXH/Q-box helicase domain of Cas3. CRISPR-associated (Cas) 3 is a nuclease-helicase responsible for degradation of dsDNA. The two enzymatic units of Cas3, a histidine-aspartate (HD) nuclease and a Superfamily 2 (SF2) helicase, may be expressed from separate genes as Cas3' (SF2 helicase) and Cas3'' (HD nuclease) or may be fused as a single HD-SF2 polypeptide. The nucleolytic activity of most Cas3 enzymes is transition metal ion-dependent. Cas3 is a member of the DEAD-like helicase superfamily, a diverse family of proteins involved in ATP-dependent RNA or DNA unwinding. This domain contains the ATP-binding region.	8.80112e-30
NZ_CP040506.1\|WP_034860055.1\|3209342_3210341_-\|type-I-B-CRISPR-associated-endonuclease-Cas1	gnl\|CDD\|187853	cd09722, Cas1_I-B, CRISPR/Cas system-associated protein Cas1. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas1 is the most universal CRISPR system protein thought to be involved in spacer integration; Cas1 is metal-dependent deoxyribonuclease, also binds RNA; Shown to possess a unique fold consisting of a N-terminal beta-strand domain and a C-terminal alpha-helical domain.	3.99299e-155
NZ_CP040506.1\|WP_006782631.1\|3228765_3229830_-\|flagellar-biosynthesis-protein-FlhB	gnl\|CDD\|376521	pfam01312, Bac_export_2, FlhB HrpN YscU SpaS Family. This family includes the following members: FlhB, HrpN, YscU, SpaS, HrcU SsaU and YopU. All of these proteins export peptides using the type III secretion system. The peptides exported are quite diverse.	1.55003e-162
NZ_CP040506.1\|WP_006782622.1\|3217601_3219017_-\|ATPase-AAA	gnl\|CDD\|225420	COG2865, COG2865, Predicted transcriptional regulator containing an HTH domain and an uncharacterized domain shared with the mammalian protein Schlafen [Transcription].	1.47536e-79
NZ_CP040506.1\|WP_006782613.1\|3206536_3206749_+\|helix-turn-helix-transcriptional-regulator	gnl\|CDD\|379188	pfam13443, HTH_26, Cro/C1-type HTH DNA-binding domain. This is a helix-turn-helix domain that probably binds to DNA.	1.83194e-15
NZ_CP040506.1\|WP_006782627.1\|3226169_3226424_-\|TfoX/Sxy-family-protein	gnl\|CDD\|377439	pfam04994, TfoX_C, TfoX C-terminal domain. TfoX may play a key role in the development of genetic competence by regulating the expression of late competence-specific genes. This family corresponds to the C-terminal presumed domain of TfoX. The domain is found associated with pfam00383 in Neisseria meningitidis TadA. It is also found as an isolated domain in some proteins suggesting this is an autonomous domain.	6.67505e-21
NZ_CP040506.1\|WP_006782625.1\|3224013_3224637_-\|DUF4194-domain-containing-protein	gnl\|CDD\|372745	pfam13835, DUF4194, Domain of unknown function (DUF4194).	8.59733e-16

>NZ_CP040506.1|WP_006782622.1|3217601_3219017_-|ATPase-AAA
MIEKLIAEATECDFKVALETRRPKSWLKSVSAFANGIGGTLFFGIDNEGKITGIEDIQSDAEAISRFIKERITPLPQFVLTPVREGDKDILLLSIAAGRTTPYYYKADGIMEAYIRVGNESVVAPDYVVNELILKGSNRSFDTLLTDARKEDYSFTLLEATYRERTGVRLETSDYFSFGLTNREGVLTNAGKLLADQYIVYNSRVFCTRWNGLEKGSIFDDALDDKEYEGNLIYLLQSSCDFVRNNSKVRFVKEARYRIDKPDYADRAVMEALVNALIHRDYIVAGSEIHVDMYDDRLEIQSPGGMFEGRPIQECDIDSIGSVRRNPVIADLFHRMKYMERRGSGLKKILSETRKLPGYTEQLKPEFFSTPSDFRVVLKNINYNMEEDTIQDTIQDTIQDTIQDKSKRMKEIIAYCKEARTREEIQSYIGIVNRAHFRRAYLKPLLKTGMLEMTLPEKPSSRNQKYISSHK
>NZ_CP040506.1|WP_006782621.1|3216540_3217239_-|CRISPR-associated-endoribonuclease-Cas6
MHYVFEIRIKIFTLQSISKEDSYAAVTDFIDGVLIENEVWEQMHNENCYKQYCFNGLYPIEKEGIYKREQVYQFIVRSTNKDLIEYLSYNLPKHENNLMKGLTCENRMISKKHITSLYSITPVIVKGKNNGYWRDDMTFEDFEQRLKVNLIKKYNELEHTKLDENFELHTLLEFKNYGPIPVPYKNVKLLADKIELKIADNETAQALAYMALGTGICEMNSRGMGFVNCHYV
>NZ_CP040506.1|WP_006782620.1|3214788_3216528_-|hypothetical-protein
MIQDCLEIFKYKLDKYDDERLVLDNYVPKDGTYILIEMSEPQWNVKDTVAIRFNKKDGKLEGKTSSNYRLISTLDYYSKLIAMNKPVDPQKVIHSNNYLSFAVKKESIATGKLSSEVLDLYYEILKNPIQKYSKPNVRKLYEETEKMCGEVDRILAEQIHQWVRENLSKLEIDTSKKDYLKLYFIFPDEAKTKELYRKEGSRYTIPNIYNNNDFNCLINDEIYGLPNDNMGMNSKKVFLANKSKRVQVPYLLNREQVMLQAKFYDFLYGQASKGNLNIYFDENRKEIIPLKNGESPTADMSGYFIRLKKGMEAEIHNVDAVPCYNPHLQTTFFYQQYLETDQSDNYGMITDRKRLELLIDDVLFGKSLISNYFTDVGDITIKDGTLVQNLIMSRELLFSWFYKNDGVNPWPVLQKCSKTMIYNSINKGYWKKTRHQINLLWSLKDYFKKEEIMYPVVESLRKHINEKDDWMFDNDEEYYFAIGQMVSYFINKSKAAKKPLSFINPFLNAKDDDMIKSHLEVLFKKYDYDIMYMDLRVKRLFSNVMIHKPVEKIDTTMIAAGVAANNLIFEKKEAERNDE
>NZ_CP040506.1|WP_034860056.1|3213833_3214796_-|type-I-CRISPR-associated-protein-Cas7
MNKRVYGVLGISSIMANWNADFSGYPKTTSDGQTYGSDKALKYPMKKMWENEGKPVIYIKSMCFEEGKKGEVNLIPRTLKERYEQVFGVELKKGGDVREVLKKLFQAVDIKNFGATFAEAGNNISITGAVQIGQGFNKYDGTEPQEQPILSPFRDPKAKEKSKKSEGDEGEEAKNSTLGTKIVSNEAHYFYPFSINPLAYKGYMELGVTEGYLESDYEMFKKAALTSATSFATNSKAGCENEFALFVETKEDFYLPTLTEYIEFEKGDVNTITITCADLFEQVKDKILSVEIYYNPYTTKIDPEKINGAKYYNILTQKEV
>NZ_CP040506.1|WP_006782618.1|3213106_3213832_-|type-I-B-CRISPR-associated-protein-Cas5
MEILKFTLKGKNAFFKMPEVNTYYYFTYGNIHKVALLGIFGAILGYNGYAQMTEEDQYPEFYERLKDISISIVPQKGSKGYIPKKVQSFNNSVGYASQEQGGNLIVKQQWLENPCWEVYVKIDSSEAEAIKKAIMNHTCVYVPYLGSNDHPADICDAEVLTGEFINDEEIAYIDSLFPAAKVELDYEDDDVTPYKYSEYLPIALDEHSLMYCMEKFYVTNIPVLCHECDVCRVGGKNIVFY
>NZ_CP040506.1|WP_006782617.1|3210484_3213031_-|CRISPR-associated-helicase/endonuclease-Cas3
MQLNDVLNFEEPIYAHICEGKNAETLQQHTKLCQKYYKKLMDTKMLKLILGRFLQRYMENCTKEAELFFWEMLEGSIIFHDTGKINPAFQRERMKKPFKYQKDFQILEGSKHSLLSSVIYLDYCYYLLAQMTMSIDEKRKLKSLIYVNAYIISRHHDDLGAMREYGEKFLEGGQIYEMISRLPNEKQTLYKGPFHFNQENIGTVCKAFPGGGKKRESREDDRKGGMELYIYARLLYSLLTSADYYATTEYMNGFAINQFGEVNQVDELRRVYEACGVLKSIREYEKTNVGTKFVAENEINALRCQLFLEAEAEWKVHKEENVFFLEAPTGSGKSNTAMNLSFQMLKAGQTKLCYVYPFNTLVEQNLDSIKRIFGGNEDIMSMVTVVNSVTPIKIDEDKKKAMSENNSEFYQSALLDRQFLNYPFILTTHVGLFETLFSNKREALFGFLQMAGSVIVLDEIQSYKNTLWSEIIIFLKAFAEFMNMKVLIMSATLPDLEYLTEESGQVVRLMKRRDQYFLNPVFRERVQLSYEMLKEKTDFEQLHHHICDHVQQEKKVLVEFIKKKSAYEFYEYACEYGILGMELRLLTGDDNRLDREKILNEIRCSDKGVILIATQVVEAGVDIDMDIGYKDISKLDSEEQFLGRINRSCKKGGVTYFFDLDNAGDIYKDDFRINRELTLENEEMREALKNKQFAEYYLSVINLLKESRNKSASEEGLEHFFKEVKHGNFKEIAAHMHLIEENSWTMSVYLSRMIELPDGTQLDGEVCWEEYKKLLLNQELPYAKKQVLLSKVRSQMNYFIYEIKKNSNLVYSDRIGELYMIQNGDRYFENGKLNKQALEEAGGMFIEL
>NZ_CP040506.1|WP_034860055.1|3209342_3210341_-|type-I-B-CRISPR-associated-endonuclease-Cas1
MGSTRYIMSMGELSRKDNSLCFRKDGKNVYIPIENTKEIYCLSEVSFNTKLLDFLAKNHVVVHFFNYYEGYSGSFYPRDQYNSGKLVIKQAETFRNSRMQVAKAIVLGIGQNMDEVLHHYYKHEKKEVKETIDWLRKEFKERVQKAEQVNELMSIEGEAWMRFYGDFKYFLPEDFVMNKRVKRPPDNPINAMISFGNTLLYVKTISSIYRTHLDQRISFLHEPSEGRFSLSLDMSEVFKPVIVYRTIFDLVNNRKIQVEKHFDKKVNYCLLNEEGRKIFIEAFEGRMESVFVHAGLKRKVSYRTAIKLDCYKLIKMILEGREFVPFSLKEGK
>NZ_CP040506.1|WP_006782614.1|3209051_3209342_-|CRISPR-associated-endonuclease-Cas2
MGKSMNYNYAFVFYDVGEKRVQKVFKICKKYLSHFQYSVFRGEMTPSKLISLRSDLKKVIDTKEDFVCIIKLMNDNVFGEEILGEANGLTGEELIL
>NZ_CP040506.1|WP_006782613.1|3206536_3206749_+|helix-turn-helix-transcriptional-regulator
MIKYDPLWETMKKRNISQYKLIKDYGIDKAQLQRLRKNEVVKTIILNKLCEILDCRIEEILVYEPDITEE
>NZ_CP040506.1|WP_006782612.1|3206083_3206425_-|hypothetical-protein
MDKVRVESKNTDSYRFKERVYRLMNGTYDLDIYSVGEMNTVETEFSDGKYCEELYKDIFEANCRICERLGEEEDKDVEIIIHNYNLMTEYLCMKMFDYGVLFCKREIAKTVVV
>NZ_CP040506.1|WP_006782623.1|3220075_3220450_-|DUF3783-domain-containing-protein
MREMVLYYNTVQNPNVAKLKGVLVRMGVRIKNITPEQVTQTVGYLAGIEGYPESEIPEVLPVIEEEMLVMRGFTSRRMDELLMNLRKAGVPKIALKAVVTESNCGWSFYHLYEEIREEHKKMSL
>NZ_CP040506.1|WP_138670220.1|3220490_3221687_-|hypothetical-protein
MAGAGNDEMLTEDKRAGAGSTGAVGMLAVAAAAEESLRAELEKRSNPRYDLMGNEYGAKLQKAIEKKDEEKQKLTDLRGEYLRVYLNRSFSLSSDDNSEYEKLLEKLSCDRLEEYRKSAAEQARSAVEHFKDDFMYKIRSAIREALIRKDELNRVISGLDFGKDKYQFYIGKNKGPDGQYYDMFMADSLEINPAQLDVSMDNQLDFFTMEHENHYGQMVNDLINVFIPPDNATPEELEEAKRNMDKYADYRTYLSFDMQQLVQNEDETIKIRLSKMIKKNSGGEGQNPLYVALLASFAQAYRINLKPKVQRNPTIRLVVLDEAFSKMDAEKVASCIQLIRGLGFQALISATNDKIQNYVETVDKIFVFANPNKKCISIQEFEREEFGELKADLVDGEG
>NZ_CP040506.1|WP_006782625.1|3224013_3224637_-|DUF4194-domain-containing-protein
MINYYEELSPEEQLKVTQSIQLLYKQTFLLERKYDKKTGRFTGNRDFYVCNKHLEFIREYFRVMGIEVMENSQLGVIYVRGEAVVGDKLPKLATLYLLILKLIYDEQMASVSSSVNVYTTLSDMHERLGNYRLFKKQPSATDIRRAISLLKKYQIIEPLEMMDELEGHSRIIIYPCINVVLFGDDVRGLLESYGEGEDEDDSDETEI
>NZ_CP040506.1|WP_006782626.1|3224633_3226013_-|hypothetical-protein
MKQLLNEIPDNFWSLFRSKNRPIYIEALLQINEEYQYSNYFLSREICIQTLSDYFSKQKIFLEQDEMEDDFDLLEPMATRILNWLLRAGWLRKVDDYYSMTVNIVIPDYAAVFVDAFTQLCSDEGDATQVYIQNIYAILFSFKNDARANLSLLKTALVNTRKLNKTLQDMLHNMDKFFASLLEKGFYGDLLKEHLDGYVEEIVRRKYHILKTSDNFYLYKTDIKMWLNEMRQNPEWLSEVCERNRRMRGKSVEVRSVLEQIDLIERGFDDIEHRIANMDKEHSKYIRATVTRLNYLLNEEDNMKGLVIQLLNHLSLSDRQDEEIGEIGGMMNLSQFTILSDKSLYRPRRPRQDFTEHLSADEEPEELSKDEILKLNKIRNRYSRKQIEEFVFSHMTDGRMEVTPGTVSSDEDFEKLVLAYDYSTRKDSPYRVREQETEAIDNGRYRYPKLVFEKKRKNG
>NZ_CP040506.1|WP_006782627.1|3226169_3226424_-|TfoX/Sxy-family-protein
MGEIAKMVNLGEVIEKQLGEVGITTAEQLRETGSKQAWLKIKAIDDSACIHRLLAMEGAIRGVKKTALPEDVKEDLREFYRAAK
>NZ_CP040506.1|WP_006782628.1|3226429_3227065_-|endonuclease-III
MTKEELALEVVERLKKEYPEAGCTLDYNQAWKLLVSVRLAAQCTDARVNVVVQDLYAKYPDVESLAEADVDDIERIVKPCGLGHSKARDISGCMKMLRDEFGGKVPDDFDALMKLPGVGRKSANLIMGDVFGKPAIVTDTHCIRLVNRIGLVDGVKEPKKVEMALWKLIPPEEGSDFCHRLVFHGRDVCTARTKPFCDRCCLKDICGKIGV
>NZ_CP040506.1|WP_006782629.1|3227143_3228052_-|FtsX-like-permease-family-protein
MNFRTWRYLFKLGWKNLWYHKVYTAASALTMSACIFLFGLLFLAVLNVDSVLQRTEEDVYVAVFFDEDVAPERIDEVGNLIRNRAEVLRTVYTTADEAWDEFRADFFEETELMEGIFEDDNPLSASSHFQVYIKGIEQQESFVAYASSLEGVRKVTHSADTVRALVKMKDVISRVAMGSAGLLVLLSVLLIHNTLSVVIEAQKDKMHVMRLMGAREEFIKVPFCVQAFVMALLGLCVPLLLLFGCYRWGVGLVSSGLRLADGGVTLLPWEAVFPQLIVACVLLGVVTGVVGALSVLGKLKKR
>NZ_CP040506.1|WP_006782630.1|3228041_3228737_-|ATP-binding-cassette-domain-containing-protein
MDNRMIVLDHVTKVYGSQKALDNVSLEIKAGEFVFLTGNSGAGKTTMLELILKETEPTKGNLIVNGIQLSQLKERQIYRYRRFIGMVFQDFKLFPDFTVYENVAFAQRVIGAEPRDMKVSVRDALFKVGLEKKAGCYPGQLSGGEKQRTALARAMVNRPVLLLADEPTGNLDQRNAEDIMRLLEKINDQGTTILTVSHNQDLVKSMKKREISVRYGKVIRDSGKGGLSYEF
>NZ_CP040506.1|WP_006782631.1|3228765_3229830_-|flagellar-biosynthesis-protein-FlhB
MAAEEKTEKATPKRRQDERKKGNVFQSNDVAAVASILVLFNSLGALAPGIYKNLKSSVELFFSYAADRNFHLTDMNVQETMGRAMIYFASAALPLLLIGVLTAVIVTFFQTRMAFSWEVMKFKLERISPMKGFKRMFSMRALVELLKAVVKITCLIVAIYLFVKSRMHEFARLMDGSVAGAVAYTGKTAIALVNTVGIAFIFVAGFDFLYQWWEYEKNLRMSKQEIKDEYKQMEGDPQIKGRIRERQRQIASRRMMQNVPKADVIIRNPTHFAVALGYDSNAHRAPVVLAKGADRVALKIVEIGEENGVYIMENPPLARGLFAAVEVDMEIPEEYYQAVAQVLAFVYKLKKKKV
>NZ_CP040506.1|WP_006782632.1|3229909_3230689_-|flagellar-biosynthetic-protein-FliR
MSQDVLQNFDIFLLVLARMAGMVLVNPVFGRKGLPMMVRMGLVLSLSLFVLPAAELQAVAVSGLTTFGMAEAIIKEVMMGLAIGYVFQLFFSMLYVAGDVLDTLFGFSMGKVMDPISGIQSSVFAQFINVFFFLYFFATGSHLLMVKIFAYTYEVVPVGVTGFVSNALLSYLINLFGSVFGMVIRLTLPFAAAEFVLEVTMGVLMKLIPQIQVFVINIQAKILLGLLLMMLFAYPVGAFLDTYISSMMTEVQTVMMSFR

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP040506_4

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP040506_4

3549713-3549844

Orphan

Consensus_repeat	Method
GTTTCTGTAGCTCAGCAGGATAGAGCGTCCGCCTCCTAAG	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_CP040506_4

>merge|NZ_CP040506|4|3549713-3549844|CRISPRCasFinder
GTTTCTGTAGCTCAGCAGGATAGAGCGTCCGCCTCCTAAGAGAACTTAGAGCGCTCGCTTTTTGGGGATTCGCCCCACAAAATTTAATACGTGTTTCTGTAGCTCAGCAGGATAGAGCGTCCGCCTCCTAAG

>NZ_CP040506|4|4|3549713-3549844|CRISPRCasFinder
GTTTCTGTAGCTCAGCAGGATAGAGCGTCCGCCTCCTAAG	AGAACTTAGAGCGCTCGCTTTTTGGGGATTCGCCCCACAAAATTTAATACGT
GTTTCTGTAGCTCAGCAGGATAGAGCGTCCGCCTCCTAAG

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP040506.1\|WP_006778079.1\|3538486_3539404_+\|protein-jag	unknown	unknown	gnl\|CDD\|224760
NZ_CP040506.1\|WP_006778081.1\|3540881_3542804_+\|tRNA-uridine-5-carboxymethylaminomethyl(34)-synthesis-enzyme-MnmG	unknown	unknown	gnl\|CDD\|235362
NZ_CP040506.1\|WP_006778083.1\|3543637_3544588_-\|alpha/beta-fold-hydrolase	unknown	unknown	gnl\|CDD\|215315
NZ_CP040506.1\|WP_006776966.1\|3556966_3559540_-\|CHAP-domain-containing-protein	unknown	unknown	gnl\|CDD\|225943
NZ_CP040506.1\|WP_006778088.1\|3548786_3549665_+\|DUF3881-family-protein	unknown	unknown	gnl\|CDD\|379014
NZ_CP040506.1\|WP_006778087.1\|3547304_3548639_+\|NADP-specific-glutamate-dehydrogenase	unknown	unknown	gnl\|CDD\|181834
NZ_CP040506.1\|WP_006776967.1\|3559676_3559910_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|378518
NZ_CP040506.1\|WP_006778085.1\|3545590_3546541_+\|ParB/RepB/Spo0J-family-partition-protein	unknown	unknown	gnl\|CDD\|275105
NZ_CP040506.1\|WP_006776437.1\|3551563_3551770_-\|helix-turn-helix-domain-containing-protein	unknown	unknown	gnl\|CDD\|378935
NZ_CP040506.1\|WP_006778080.1\|3539483_3540857_+\|tRNA-uridine-5-carboxymethylaminomethyl(34)-synthesis-GTPase-MnmE	unknown	unknown	gnl\|CDD\|235392
NZ_CP040506.1\|WP_006778084.1\|3544820_3545591_+\|ParA-family-protein	unknown	unknown	gnl\|CDD\|379293
NZ_CP040506.1\|WP_006778086.1\|3546563_3547064_+\|DUF4446-family-protein	unknown	unknown	gnl\|CDD\|379655
NZ_CP040506.1\|WP_006776441.1\|3553978_3554425_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP040506.1\|WP_006778082.1\|3542793_3543519_+\|16S-rRNA-(guanine(527)-N(7))-methyltransferase-RsmG	unknown	unknown	gnl\|CDD\|234637
NZ_CP040506.1\|WP_006778091.1\|3556385_3556928_+\|sigma-70-family-RNA-polymerase-sigma-factor	unknown	unknown	gnl\|CDD\|274357
NZ_CP040506.1\|WP_138670240.1\|3554511_3554898_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP040506.1\|WP_006776439.1\|3552376_3552733_+\|winged-helix-turn-helix-transcriptional-regulator	unknown	unknown	gnl\|CDD\|367747
NZ_CP040506.1\|WP_006776440.1\|3552746_3553967_+\|M56-family-metallopeptidase	unknown	unknown	gnl\|CDD\|320700
NZ_CP040506.1\|WP_006778089.1\|3550136_3551549_-\|tyrosine-type-recombinase/integrase	unknown	unknown	gnl\|CDD\|271189
NZ_CP040506.1\|WP_006776443.1\|3555031_3556261_+\|hypothetical-protein	unknown	unknown	unknown

Protein	Function_ID	Function_description	E-value
NZ_CP040506.1\|WP_006778079.1\|3538486_3539404_+\|protein-jag	gnl\|CDD\|224760	COG1847, Jag, Predicted RNA-binding protein [General function prediction only].	1.97342e-47
NZ_CP040506.1\|WP_006778081.1\|3540881_3542804_+\|tRNA-uridine-5-carboxymethylaminomethyl(34)-synthesis-enzyme-MnmG	gnl\|CDD\|235362	PRK05192, PRK05192, tRNA uridine-5-carboxymethylaminomethyl(34) synthesis enzyme MnmG.	0
NZ_CP040506.1\|WP_006778083.1\|3543637_3544588_-\|alpha/beta-fold-hydrolase	gnl\|CDD\|215315	PLN02578, PLN02578, hydrolase.	1.91806e-17
NZ_CP040506.1\|WP_006776966.1\|3556966_3559540_-\|CHAP-domain-containing-protein	gnl\|CDD\|225943	COG3409, COG3409, Putative peptidoglycan-binding domain-containing protein [Cell envelope biogenesis, outer membrane].	1.16834e-15
NZ_CP040506.1\|WP_006778088.1\|3548786_3549665_+\|DUF3881-family-protein	gnl\|CDD\|379014	pfam12997, DUF3881, Domain of unknown function, E. rectale Gene description (DUF3881). Based on Eubacterium rectale gene EUBREC_3695. As seen in gene expression experiments (http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE14737), it appears to be upregulated in the presence of Bacteroides thetaiotaomicron vs when isolated in culture.	1.71456e-154
NZ_CP040506.1\|WP_006778087.1\|3547304_3548639_+\|NADP-specific-glutamate-dehydrogenase	gnl\|CDD\|181834	PRK09414, PRK09414, NADP-specific glutamate dehydrogenase.	0
NZ_CP040506.1\|WP_006776967.1\|3559676_3559910_-\|hypothetical-protein	gnl\|CDD\|378518	pfam10960, Holin_BhlA, BhlA holin family. The Phage_holin_BhlA family is a family of holin-like proteins from both bacteriophages and bacterial chromosomes. In bacteriophage, holins are small membrane proteins that accumulate and oligomerize to form non-specific lesions in the cytoplasmic membrane allowing the release of the second protein, endolysins, to access the peptidoglycan. Most holins share common structural features: two or three transmembrane domains separated by a beta-turn, a short hydrophilic N-terminus, a highly charged C-terminus and a dual translational start motif. The BhlA holin of Bacillus is found to be toxic to the host cell where the site of action of is on the cell membrane and causes bacterial death by cell membrane disruption.	1.54845e-15
NZ_CP040506.1\|WP_006778085.1\|3545590_3546541_+\|ParB/RepB/Spo0J-family-partition-protein	gnl\|CDD\|275105	TIGR04285, parB-like_partition_protein, nucleoid occlusion protein. This model describes nucleoid occlusion protein, a close homolog to ParB chromosome partitioning proteins including Spo0J in Bacillus subtilis. Its gene often is located near the gene for the Spo0J ortholog. This protein bind a specific DNA sequence and blocks cytokinesis from happening until chromosome segregation is complete.	1.14667e-81
NZ_CP040506.1\|WP_006776437.1\|3551563_3551770_-\|helix-turn-helix-domain-containing-protein	gnl\|CDD\|378935	pfam12728, HTH_17, Helix-turn-helix domain. This domain is a DNA-binding helix-turn-helix domain.	1.42762e-10
NZ_CP040506.1\|WP_006778080.1\|3539483_3540857_+\|tRNA-uridine-5-carboxymethylaminomethyl(34)-synthesis-GTPase-MnmE	gnl\|CDD\|235392	PRK05291, trmE, tRNA uridine-5-carboxymethylaminomethyl(34) synthesis GTPase MnmE.	0
NZ_CP040506.1\|WP_006778084.1\|3544820_3545591_+\|ParA-family-protein	gnl\|CDD\|379293	pfam13614, AAA_31, AAA domain. This family includes a wide variety of AAA domains including some that have lost essential nucleotide binding residues in the P-loop.	2.40768e-105
NZ_CP040506.1\|WP_006778086.1\|3546563_3547064_+\|DUF4446-family-protein	gnl\|CDD\|379655	pfam14584, DUF4446, Protein of unknown function (DUF4446). This family of proteins is functionally uncharacterized. This family of proteins is found in bacteria and eukaryotes. Proteins in this family are typically between 165 and 176 amino acids in length.	4.12077e-71
NZ_CP040506.1\|WP_006778082.1\|3542793_3543519_+\|16S-rRNA-(guanine(527)-N(7))-methyltransferase-RsmG	gnl\|CDD\|234637	PRK00107, gidB, 16S rRNA (guanine(527)-N(7))-methyltransferase RsmG.	1.67482e-84
NZ_CP040506.1\|WP_006778091.1\|3556385_3556928_+\|sigma-70-family-RNA-polymerase-sigma-factor	gnl\|CDD\|274357	TIGR02937, RNA_polymerase_sigma_factor, RNA polymerase sigma factor, sigma-70 family. This model encompasses all varieties of the sigma-70 type sigma factors including the ECF subfamily. A number of sigma factors have names with a different number than 70 (i.e. sigma-38), but in fact, all except for the Sigma-54 family (TIGR02395) are included within this family. Several Pfam models hit segments of these sequences including Sigma-70 region 2 (pfam04542) and Sigma-70, region 4 (pfam04545), but not always above their respective trusted cutoffs.	6.71973e-11
NZ_CP040506.1\|WP_006776439.1\|3552376_3552733_+\|winged-helix-turn-helix-transcriptional-regulator	gnl\|CDD\|367747	pfam03965, Penicillinase_R, Penicillinase repressor. The penicillinase repressor negatively regulates expression of the penicillinase gene. The N-terminal region of this protein is involved in operator recognition, while the C-terminal is responsible for dimerization of the protein.	1.10529e-22
NZ_CP040506.1\|WP_006776440.1\|3552746_3553967_+\|M56-family-metallopeptidase	gnl\|CDD\|320700	cd07341, M56_BlaR1_MecR1_like, Peptidase M56-like including those in BlaR1 and MecR1, integral membrane metallopeptidase. This family contains peptidase M56, which includes zinc metalloprotease domain in MecR1 as well as BlaR1. MecR1 is a transmembrane beta-lactam sensor/signal transducer protein that regulates the expression of an altered penicillin-binding protein PBP2a, which resists inactivation by beta-lactam antibiotics, in methicillin-resistant Staphylococcus aureus (MRSA). BlaR1 regulates the inducible expression of a class A beta-lactamase that hydrolytically destroys certain ?-lactam antibiotics in MRSA. Both, MecR1 and BlaR1, are transmembrane proteins that consist of four transmembrane helices, a cytoplasmic zinc protease domain, and the soluble C-terminal extracellular sensor domain, and are highly similar in sequence and function. The signal for protein expression is transmitted by site-specific proteolytic cleavage of both the transducer, which auto-activates, and the repressor, which is inactivated, unblocking gene transcription. All members contain the zinc metalloprotease motif (HEXXH). Homologs of this peptidase domain are also found in a number of other bacterial genome sequences, most of which are as yet uncharacterized.	4.55644e-43
NZ_CP040506.1\|WP_006778089.1\|3550136_3551549_-\|tyrosine-type-recombinase/integrase	gnl\|CDD\|271189	cd01189, INT_ICEBs1_C_like, C-terminal catalytic domain of integrases from bacterial phages and conjugate transposons. This family of tyrosine based site-specific integrases is has origins in bacterial phages and conjugate transposons. One member is the integrase from Bacillus subtilis conjugative transposon ICEBs1. ICEBs1 can be excised and transfered to various recipients in response to DNA damage or high concentrations of potential mating partners. The family belongs to the superfamily of DNA breaking-rejoining enzymes, which share the same fold in their catalytic domain and the overall reaction mechanism. The catalytic domain contains six conserved active site residues. Their overall reaction mechanism involves cleavage of a single strand of a DNA duplex by nucleophilic attack of a conserved tyrosine to give a 3' phosphotyrosyl protein-DNA adduct. In the second rejoining step, a terminal 5' hydroxyl attacks the covalent adduct to release the enzyme and generate duplex DNA.	1.78905e-17

>NZ_CP040506.1|WP_006778088.1|3548786_3549665_+|DUF3881-family-protein
MHKFLRTVGFSMYQKKRDIDKLIQGLAEDRDKMRILQLDSEESLCELRVETAPGMGIAIVGGLDERDRFDVEYYYPYFVSHERSSIADCSIQRHTEKETYAGLLDDYRVGISLIYYVENMMEYRTRELAHESVDVDYVSLSGLCVNGKVLLPIQKTQKQIEMAKVASKDRNNLLEAAKNGDEDAMETLTIEDIDLYSQVSKRMIKEDIYSIIDTCFLPCGIECDQYSVIGDILHIDVFKNRITEEEVYDFTLDCNDIIFHTAINKKDLIGEPKVGRRFKGQIWMQGTAKFKS
>NZ_CP040506.1|WP_006778087.1|3547304_3548639_+|NADP-specific-glutamate-dehydrogenase
MSYVDEIYARVVEQNPGENEFHQAVKEVLDSLKLVIDANEEKYRKVALLERLVEPERVISFRVPWVDDNGQVQVNKAYRVQFNSAIGPYKGGLRFHPSVNQGILKFLGFEQTFKNSLTGLPIGGGKGGSNFDPKGKSDREVMAFCQSLMTELYKYIGKDQDVPAGDIGVGAREIGYLYGEYKRITGLYEGVLTGKGLTYGGSLIRTQATGYGLVYILDEMLKNNGKELSGKTVLVSGSGNVAIYAVEKVHELGGKVVAMSDSNGYIYDKDGIKLDIVKDIKEVRRGRIKEYVDAVPTAVYTEGKGIWTIPCDIALPCATQNELNLDDAKALFENGCFAVAEGANMPSTREATDFFVEKKMLFMPGKAANAGGVATSALEQSQNSQRLSWTAEEVDAKLKGIMVNIFAKADDAAKRYGVAGNYVAGANIAGFEKVVEAMMAQGVV
>NZ_CP040506.1|WP_006778086.1|3546563_3547064_+|DUF4446-family-protein
MENSMLSSWSIDPAFIILGLGVVTLILLVITIVCVVQIRKLYRRYDIFMRGKDAETLEDTIFGLIDELKEMKAEDKANKEAIRVLTRNVRGTYQKFGMVKYNAFKGMGGNLSFAFALLDLNNTGFVLNSVHSREGCYLYIKIVEKGETEVLLGSEEKEALEQALGY
>NZ_CP040506.1|WP_006778085.1|3545590_3546541_+|ParB/RepB/Spo0J-family-partition-protein
MAKRTGLGKGLGAIFGEDVMDSAQADQLKEEKGEYKTGREKTVKAGSKEEEETGKEITLKLSQIEPNTGQPRKDFNPEMIQELAGSIRQYGVLQPLLVQKKGDHYEIIAGERRWRAAKEAGLKEIPVVIREYTKQQTMEIALIENVQREDLNPIEEAQAYQQLMQEFDLTQEEIAARVSKNRATITNSMRLLKLDKRVQEMLTQGMISSGHARALLALEDGEQQYQVALKIASERLSVRDVEKLVKQLSKPKKAKKVEEEERDLSFIFKDLEERMKQIMGTKVNINKKDRNKGRIEIEYYSEAELERLVELIESIR
>NZ_CP040506.1|WP_006778084.1|3544820_3545591_+|ParA-family-protein
MGRIIAIANQKGGVGKTTTTINLSACLAEAGQKVLLVDFDPQGNATSGVGLEKGYIDKTVYELLVDECQIEECLVKEVQENLDVLPSDVNLAGAEIELLDLEDKELLLKQQLDKIKDDYDYILIDCPPALSLLTINALTAANTVLIPIQCEYYALEGLNQVLKTVGLVHKKLNPNLETEGVVFTMYDARTNLSLEVVESVKSTLNQNIYKTIIPRNVRLAEAPSHGIPINLYDSRSTGAESYRLLAAEVMSRGEDI
>NZ_CP040506.1|WP_006778083.1|3543637_3544588_-|alpha/beta-fold-hydrolase
MTNKNKLLTMLILSSSAVAATALINKCIKISATSKNILEEPESFCYRWRFGNIHYTKSGSGKPLLLIHDLDAASSGYEWNQVVSSLSKEYTVYTMDLLGCGRSEKPCLTYTNYLYVQLIADFVKSEIGHRTDVISTGHSSALAIMACNNNPELFDKLLLINPDSILTCSQIPGKYAKLYKGFLDLPVIGTLLYHIATSKQAIRESFITQYFYNPYSVRESYVNSYYEAAHLNLSPKSVYASVHCNYTKANIVNAIKKIDNSIYIIGGAGMDNIKDLLNEYTIYNPAIEYTLLPDTKYLPQLEKPAEFVSTVKMFFS
>NZ_CP040506.1|WP_006778082.1|3542793_3543519_+|16S-rRNA-(guanine(527)-N(7))-methyltransferase-RsmG
MFDKFTELMREELSEFSIELSEHQLHQFYQYFELLVEWNKVMNLTAITELEDVVTKHFVDSLSLVKAVSDLSDEKILDMGTGAGFPGIPLKIAFPELKITLLDSLNKRINFLNEVIGQLQLGEIQAVHGRAEDYGRDKLYREQYDYCVSRAVANLSTLSEYCMPYVKIGGAFIPYKSGKIEEELNQAKGAVKLLGGKIEEVVTFVLPKTDVERSFVIVRKTEGTSKKYPRKAGLPSKEPLK
>NZ_CP040506.1|WP_006778081.1|3540881_3542804_+|tRNA-uridine-5-carboxymethylaminomethyl(34)-synthesis-enzyme-MnmG
MPNLEETYDIVVVGAGHAGCEAALACARLGLETIMFTVSVDSIALMPCNPNIGGSSKGHLVRELDALGGEMGKNIDKTFIQSKMLNESKGPAVHSLRAQADKQEYSRNMRQVLENTDHLTVRQAEVSEILVEDGRIQGVRTYSGAVYHSKAVILATGTYLKARCIYGDVSNATGPNGLQAANHLTDSLKAHGVEMFRFKTGTPARVDRRSIDFSKMEEQFGDERVVPFSFSTDPESIQKEQVSCWLTYTNSNTHEIIRANLDRSPLFSGAIEGTGPRYCPSIEDKVVKFPDKDRHQVFVEPEGLYTNEMYLGGMSSSLPEDVQYAMYRTVPGLEQVKIVRNAYAIEYDCINALQLKPTLEFKKIEGLFSGGQFNGSSGYEEAAVQGFMAGVNASMKILGREPYVLDRSQAYIGVLIDDLVTKENHEPYRMMTSRAEYRLLLRQDNADLRLRKIGYEIGLVSREDYEKLVEKEKNIEREVDRLEHTNIGANKQVQEFLESHGSTALKTGATLAELVRRPELNYFMLTEIDSERPDLSADTAEQVNINIKYEGYIKRQQQQVSQFKKLERKKLDEKFDYNSVKGLRREAIQKLNAHKPVSIGQASRISGVSPADISVLLVYLEQQRHQHQESCTELEEENVR
>NZ_CP040506.1|WP_006778080.1|3539483_3540857_+|tRNA-uridine-5-carboxymethylaminomethyl(34)-synthesis-GTPase-MnmE
MKTDTIAAIATAMSSSGIGIIRISGEQAFSVLQEIFRTKQGKKLDKIVSHRVHYGHIYDGNEMIDEVLVLVMRGPHSYTAEDTVEIDCHGGVLMMKKILETVIKYGARPAEPGEFTKRAFLNGRIDLSQAEAVIGVINAKNQYALKSSVSQLAGSVSDRIKRLREQIIYEIAFIESALDDPEHISLDGYGEKLLGNLEPMIQEMEKLVSSADNGRVMTEGVRTVILGKPNAGKSSLMNVLVGEERAIVTDVAGTTRDTLEEHIRLQGISLNIIDTAGIRETEDVVEKIGVLKARNMADEADLIIFVVDASIPLDENDEEIIELIRNKKAVVLLNKTDLEMTVTKEYLEEKTGHVVIPVSAKEETGIELLEQEIKSMFYQGEIDFNDEVTITNVRHKTALVEALASLRMVRQSVCDGMPEDFYSIDLMNAYEVLGSVIGEAVEEDLVNEIFSKFCTGK
>NZ_CP040506.1|WP_006778079.1|3538486_3539404_+|protein-jag
MNTITVSAKTLDEAITKALIELGTTSDNLDYTVIDEGSAGFLGIIGAKPVKISAKKKRELDTLDDFLDKDQEAKKQQEAAKREAKAAQKAAKPVEKKPAKPVRENKPVKEEKVYKEEKVVKEEKAAPVENQEKPVVSSKKSVDGTVYEETAKKFLVQMFAAMNMEVEITASYHEGDKELYVDMSGADMGILIGKRGQTLDSLQYLVSLVVNKDCDGYVRVKLDTENYRARRKDTLETLAKNIAYKVKRTRRSVSLEPMNPYERRIIHSALQNDKFVITRSEGEEPFRHVVVSLKRENRENRDKNN
>NZ_CP040506.1|WP_006778089.1|3550136_3551549_-|tyrosine-type-recombinase/integrase
MASIVKRGKTYSVVYYEGTGDKRQQKWESGLTYSAAKSMKAKIEHEQAQQTTGDESKNRLKEMTISEFLYEFIEKYGYKKWAASTYDGNVGLLENYVHPHIGDKKLLSLTTKMIDDYYDFLEKEAEPATNMGKPTREHITASTIHDIHKILRCAFNLAVRWDYRKKNPFLNATLPEHKEQERVVLEPNQILKVLKYTCRPDNYDYYLIHCAVLIAIGCTIRGGEIGGLQWDRVHYEKMIFHIDRAIDRISKKNLKLPKVRILFKFPNLIPGAKTCIVLKQPKTDNSARDVDVPQMVLNSLQILRQMQEKLKAELGSDGYIDYNLVICQANGRPMMTEHLNKRFKEILVEMNDPEIKAEEIVFHSLRHTSATAKLFVSQGDFNSVMQAGGWANLEMLTRRYGKHSFQDNREKLAHKMDDFLGNGLEEASGNDGGTVIAQPGAIEQALQTLFQANPDLLIQVIQSVQSANKE
>NZ_CP040506.1|WP_006776437.1|3551563_3551770_-|helix-turn-helix-domain-containing-protein
MAVGEFNHEKQAVSEKRTYSVQEIADILQISRSMAYNLCKQSLFKTVKVGKYVRVSKPSFDEWLDTRK
>NZ_CP040506.1|WP_006776439.1|3552376_3552733_+|winged-helix-turn-helix-transcriptional-regulator
MEKRLFDSELKVMETLWENGELSAKQIAELLRQQIGWSKTTTYTVLKKCIDKEIIKRSDPNYICSACISKEDVRQYETHELINKMYDGAPDKLVASIIGNEKMDKDMIRHLKELIQNL
>NZ_CP040506.1|WP_006776440.1|3552746_3553967_+|M56-family-metallopeptidase
MEGIIAAHVSGSIMICFILLLRKLFVFHFVGSAWAIFWKILTLRLLCPFTIRLPGIEHFFITEKKNSHIRDTAERIVQYENNIPNELAIMIPIIWGIGGLICMGKFVIPHIKNRKVYQMALPLENESVAIWIKRQSLRRKIYVKVSDRIITPLTYSIWKPVILLPRMDGEIDELHLEQILEHELIHIKRFDVLFKWLLAFICAVYWVNPFIWIMYSFANRDIELACDEAVLKSRSKDYKKSYILTLIYLEEKRVRGDFLCNFFSRYPMEERVQIMIRNGDKKALKNMILPAIAALLIALFSISSMAGEYDGEWSPKNERRDNRNLTATTTDIQMQLPIFQKRLPDNFGSLSGGDFDIPTIIIRKSKENYSACAVDKNGTVIYEESGTTKNVEATLEHIYNKLFQRN
>NZ_CP040506.1|WP_006776441.1|3553978_3554425_+|hypothetical-protein
MRIGKHFWVLIIAVLISLSAISSVMAEEINSNVTDIPTLEITRDETGCYSVLAKDHEGSIIFTEKGLTGTIEDIIEHSYSNIFRAATKSCTHIPCNHEIVTGGINHVIDWDTDICTMITNDFYRCACCDQILGIVPGSTTVVGTHPAH
>NZ_CP040506.1|WP_138670240.1|3554511_3554898_+|hypothetical-protein
MSSSFPAYAVSTDSTVVGGWDEDTGYFVNADAYNKAMEKRGLLRSDPVHEGERQRKDQSGNTYFRAHGWTSWPGVYHYTRARMETYGGSILTDSGRKWGTSETQATSPWHKFDPDVSDRARTYYGSEE
>NZ_CP040506.1|WP_006776443.1|3555031_3556261_+|hypothetical-protein
MIKSSRIYNFFFKNSFSVLCIMLLTVFIFIVGITLTSLTISKPTSENKEHVSIGEKRYTLIDNFLDADSFREFRHNDKKVNMLGDFYNKLTGMDNAKLLSMFNQSVVIDDFQGDEKFYYHTKEFRDKFPDAELAIKSMQMNQLAFEHNKLKVKKGNMPIWNKISFNDNTFPILLGSSYEGIYNIGDIVKGSFYTKNINFQVIGILEDNTQVYYKTDPAYMLDEYIIIPYPAMAWTVNPNDFVFEGILYFALVNSDIVIDSDEKNFLTGIRAIANSTGFVDFSLVGIDDQIIKNQELIFMISEHQRLIGCILVVMYIILTAVLYCQLKVHLKKNDISGQPVFNGPSDRKKFFRKYSMFYVISFILSLVLQLRLIPRIFLGVFAAELLILGSVYLIVSLAYYKMFLKENMK
>NZ_CP040506.1|WP_006778091.1|3556385_3556928_+|sigma-70-family-RNA-polymerase-sigma-factor
MERDKLCSKIRDYKNGNRIALNEIISQMTPLVKKFARKCFFMEYDDAFQEFSMVLIEAVSKIRTYENDGQCIVYINTCFKNKYCLLCKNYYIYKEIEELYENKDIPSQIECFSDIIFIIDISRYINQIECDSHKKIAELYLVEGKSDREISETLCISRQYVNRVRRRLLNDLRTEYFMQK
>NZ_CP040506.1|WP_006776966.1|3556966_3559540_-|CHAP-domain-containing-protein
MLLKNGDTGIQVKYLQQGLKIMCCNPGSIDSAFGPGTQAAVEKFQEEWGLTVDGIVGNDTWNCLLAEIKPIQQALKNKGFYTGAITGIAKDSTYNAVIRFQSSRDLTADGMVGAATRARLFNEDQGGGDESMLPLSIGDRGDYVLYLQYGLRILCCSPGALDGVFGSGTAEAVKKFQAKYGITDNGIADTTTWNTLKGQITDIQSRLLERNYSIAIVDGLATSALVETIKKYQEANWLTADGQVGPATYELLFSDVEDGATDALPLKTGSRGPRVLYFQYALRISCINPNGTDGVYGPGTKSAVDRYKTRKGLTADGMVDTVTWEKMRDEIRPLQTALVNRGYDVGFVDGIATEKVYNSVLQFQTDHNLVADGMIGNATKALLLGGTAGGGTVSSTLKLGSNGSLTRYLQRLFNELGYQIPIDGIFSQETHNAALSFQTTHGLEADGIVGGGTWRKLFEVYRVDVPGTGVEKLLNVVKHELAWGFAEDNANNITPYGQWYEMNRSPWCAMFVSYCAYQAGVLDTLVPKFAWCPSGMTWYKNRQKYHKRNSGYIPKKGDVIFFYNDELGRVAHTGIVVDGDENYVTTIEGNTTIDAVEQRTYNRNHSTIDGYGDNGGEAIELPAPPTEEEINEILVDHYREFLDACYIILPSEQITLNYEATIPMPPNGKALVEASADTTIFDNSINNPNAVTFDVEGGIAMSQEIALSEALTLTFEESGLEDAQSLADIVFDINMSLDTGASVVASGIRTEADGTWFYISYAVKKEVQIADGYPPVNFVFKYTLCLKSDDSAGARFFELVEEFVTEYRKEINVVVGVAAVIGLAIAFKALLLAGGISGLIAATKAVLGAAAKVAIVA
>NZ_CP040506.1|WP_006776967.1|3559676_3559910_-|hypothetical-protein
MEELIVNLVQSQGIWAVLFVFLLLYTIKKNDKLDELQEARERKYQELLTQLTVKLSIVNTVNEKLDTIQAVLKEKSD

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP040506_5

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP040506_5

4011840-4011944

Orphan

Consensus_repeat	Method
CTGGACCTGTCAGTGCGGAACGGTGAA	CRISPRCasFinder

1 spacers

WYL

The CRISPR arrays of NZ_CP040506_5

>merge|NZ_CP040506|5|4011840-4011944|CRISPRCasFinder
CTGGACCTGTCAGTGCGGAACGGTGAATGCGGGCAAGTTCTGCTCGGAGTGTGGCAGCCCCAAACCGGCGCCGGCTTCCTGGACCTGCCAGTGCGGAACGGTGAA

>NZ_CP040506|5|5|4011840-4011944|CRISPRCasFinder
CTGGACCTGTCAGTGCGGAACGGTGAA	TGCGGGCAAGTTCTGCTCGGAGTGTGGCAGCCCCAAACCGGCGCCGGCTTC
CTGGACCTGCCAGTGCGGAACGGTGAA

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP040506.1\|WP_006778460.1\|4019917_4020172_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP040506.1\|WP_034857842.1\|4020382_4021315_+\|WYL-domain-containing-transcriptional-regulator	WYL	pfam13280_WYL_CAS-I:CAS-III	gnl\|CDD\|379100
NZ_CP040506.1\|WP_006778457.1\|4016814_4018092_+\|serine-dehydratase-subunit-alpha-family-protein	unknown	unknown	gnl\|CDD\|226206
NZ_CP040506.1\|WP_006778449.1\|4007850_4008801_+\|ABC-transporter-ATP-binding-protein	unknown	unknown	gnl\|CDD\|224054
NZ_CP040506.1\|WP_006778444.1\|4001232_4003371_+\|RNA-degradosome-polyphosphate-kinase	unknown	unknown	gnl\|CDD\|235469
NZ_CP040506.1\|WP_034857837.1\|4005397_4007851_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP040506.1\|WP_006778453.1\|4012005_4013037_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|224119
NZ_CP040506.1\|WP_006778456.1\|4016281_4016584_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP040506.1\|WP_138669841.1\|4004266_4005391_+\|HAMP-domain-containing-protein	unknown	unknown	gnl\|CDD\|223715
NZ_CP040506.1\|WP_080568845.1\|3997172_3998228_+\|prephenate-dehydratase	unknown	unknown	gnl\|CDD\|270349
NZ_CP040506.1\|WP_006778455.1\|4014037_4015867_-\|ferrous-iron-transporter-B	unknown	unknown	gnl\|CDD\|273077
NZ_CP040506.1\|WP_006778458.1\|4018095_4019289_+\|dicarboxylate/amino-acid:cation-symporter	unknown	unknown	gnl\|CDD\|366058
NZ_CP040506.1\|WP_006778451.1\|4009829_4010663_+\|deoxyribonuclease-IV	unknown	unknown	gnl\|CDD\|179214
NZ_CP040506.1\|WP_006778459.1\|4019432_4019723_-\|helix-turn-helix-transcriptional-regulator	unknown	unknown	gnl\|CDD\|238045
NZ_CP040506.1\|WP_006778443.1\|3999684_4001229_+\|HD-domain-containing-protein	unknown	unknown	gnl\|CDD\|223326
NZ_CP040506.1\|WP_006778445.1\|4003560_4004265_+\|response-regulator-transcription-factor	unknown	unknown	gnl\|CDD\|223816
NZ_CP040506.1\|WP_138670257.1\|4013081_4013978_+\|TPM-domain-containing-protein	unknown	unknown	gnl\|CDD\|377378
NZ_CP040506.1\|WP_006778464.1\|4022880_4023234_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP040506.1\|WP_006778442.1\|3998241_3999540_+\|ATP-binding-protein	unknown	unknown	gnl\|CDD\|377544
NZ_CP040506.1\|WP_006778450.1\|4008790_4009684_+\|ABC-transporter-permease	unknown	unknown	gnl\|CDD\|378925

Protein	Function_ID	Function_description	E-value
NZ_CP040506.1\|WP_006778457.1\|4016814_4018092_+\|serine-dehydratase-subunit-alpha-family-protein	gnl\|CDD\|226206	COG3681, COG3681, L-cysteine desulfidase [Amino acid transport and metabolism].	7.03808e-119
NZ_CP040506.1\|WP_138669841.1\|4004266_4005391_+\|HAMP-domain-containing-protein	gnl\|CDD\|223715	COG0642, BaeS, Signal transduction histidine kinase [Signal transduction mechanisms].	1.01033e-58
NZ_CP040506.1\|WP_006778444.1\|4001232_4003371_+\|RNA-degradosome-polyphosphate-kinase	gnl\|CDD\|235469	PRK05443, PRK05443, polyphosphate kinase; Provisional.	0
NZ_CP040506.1\|WP_138670257.1\|4013081_4013978_+\|TPM-domain-containing-protein	gnl\|CDD\|377378	pfam04536, TPM_phosphatase, TPM domain. This family was first named TPM domain after its founding proteins: TLP18.3, Psb32 and MOLO-1. In Arabidopsis, this domain is called the thylakoid acid phosphatase -TAP - domain and has a Rossmann-like fold. In plants, the family resides in the thylakoid lumen attached to the outer membrane of the chloroplast/plastid. It is active in the photosystem II.	1.34703e-29
NZ_CP040506.1\|WP_006778453.1\|4012005_4013037_+\|hypothetical-protein	gnl\|CDD\|224119	COG1198, PriA, Primosomal protein N' (replication factor Y) - superfamily II helicase [DNA replication, recombination, and repair].	0.00321725
NZ_CP040506.1\|WP_034857842.1\|4020382_4021315_+\|WYL-domain-containing-transcriptional-regulator	gnl\|CDD\|379100	pfam13280, WYL, WYL domain. WYL is a Sm-like SH3 beta-barrel fold containing domain. It is a member of the WYL-like superfamily, named for three conserved amino acids found in a subset of the superfamily. However, these residues are not strongly conserved throughout the family. Rather, the conservation pattern includes four basic residues and a position often occupied by a cysteine, which are predicted to line a ligand-binding groove typical of the Sm-like SH3 beta-barrels. A WYL domain protein (sll7009) is a negative regulator of the I-D CRISPR-Cas system in Synechocystis sp. It is predicted to be a ligand-sensing domain that could bind negatively charged ligands, such as nucleotides or nucleic acid fragments, to regulate CRISPR-Cas and other defense systems such as the abortive infection AbiG system.	3.92162e-16
NZ_CP040506.1\|WP_080568845.1\|3997172_3998228_+\|prephenate-dehydratase	gnl\|CDD\|270349	cd13631, PBP2_Ct-PDT_like, Catalytic domain of prephenate dehydratase from Chlorobium tepidum and similar proteins, subgroup 2; the type 2 periplasmic binding protein fold. Prephenate dehydratase (PDT, EC:4.2.1.51) converts prephenate to phenylpyruvate through dehydration and decarboxylation reactions. PDT plays a key role in the biosynthesis of L-Phe in organisms that utilize the shikimate pathway. PDT is allosterically regulated by L-Phe and other amino acids. The catalytic PDT domain consists of two similar subdomains with a cleft in between, which hosts the highly conserved active site. In gram-postive bacteria and archaea, PDT is a monofunctional enzyme, consisting of a catalytic domain (PDT domain) and a regulatory domain (ACT) (aspartokinase, chorismate mustase domain). In gram-negative bacteria, PDT exists as fusion protein with chorismate mutase (CM), forming a bifunctional enzyme, P-protein (PheA). The CM in the P-protein catalyzes the pericycle isomerization of chorismate to prephenate that serves as a substrate for PDT. The CM and PDT are essentail enzymes for the biosynthesis of aromatic amino acids in microorganisms but are not found in humans. Thus, both CM and PDT can potentially serve as drug targets against microbial pathogens. The PDT domain has the same structural fold as the type 2 periplasmic binding proteins (PBP2), many of which are involved in chemotaxis and uptake of nutrients and other small molecules from the extracellular space as a primary receptor. The PBP2 proteins are typically comprised of two globular subdomains connected by a flexible hinge and bind their ligand in the cleft between these domains in a manner resembling a Venus flytrap.	2.79058e-96
NZ_CP040506.1\|WP_006778455.1\|4014037_4015867_-\|ferrous-iron-transporter-B	gnl\|CDD\|273077	TIGR00437, Ferrous_iron_transport_protein_B_homolog, ferrous iron transporter FeoB. FeoB (773 amino acids in E. coli), a cytoplasmic membrane protein required for iron(II) update, is encoded in an operon with FeoA (75 amino acids), which is also required, and is regulated by Fur. There appear to be two copies in Archaeoglobus fulgidus and Clostridium acetobutylicum. [Transport and binding proteins, Cations and iron carrying compounds].	2.26109e-94
NZ_CP040506.1\|WP_006778458.1\|4018095_4019289_+\|dicarboxylate/amino-acid:cation-symporter	gnl\|CDD\|366058	pfam00375, SDF, Sodium:dicarboxylate symporter family.	1.79159e-65
NZ_CP040506.1\|WP_006778451.1\|4009829_4010663_+\|deoxyribonuclease-IV	gnl\|CDD\|179214	PRK01060, PRK01060, endonuclease IV; Provisional.	6.7499e-115
NZ_CP040506.1\|WP_006778459.1\|4019432_4019723_-\|helix-turn-helix-transcriptional-regulator	gnl\|CDD\|238045	cd00093, HTH_XRE, Helix-turn-helix XRE-family like proteins. Prokaryotic DNA binding proteins belonging to the xenobiotic response element family of transcriptional regulators.	9.59643e-14
NZ_CP040506.1\|WP_006778443.1\|3999684_4001229_+\|HD-domain-containing-protein	gnl\|CDD\|223326	COG0248, GppA, Exopolyphosphatase [Nucleotide transport and metabolism / Inorganic ion transport and metabolism].	2.26639e-40
NZ_CP040506.1\|WP_006778445.1\|4003560_4004265_+\|response-regulator-transcription-factor	gnl\|CDD\|223816	COG0745, OmpR, Response regulators consisting of a CheY-like receiver domain and a winged-helix DNA-binding domain [Signal transduction mechanisms / Transcription].	1.00018e-87
NZ_CP040506.1\|WP_006778442.1\|3998241_3999540_+\|ATP-binding-protein	gnl\|CDD\|377544	pfam05673, DUF815, Protein of unknown function (DUF815). This family consists of several bacterial proteins of unknown function.	7.90895e-117
NZ_CP040506.1\|WP_006778450.1\|4008790_4009684_+\|ABC-transporter-permease	gnl\|CDD\|378925	pfam12698, ABC2_membrane_3, ABC-2 family transporter protein. This family is related to the ABC-2 membrane transporter family pfam01061.	2.56277e-07
NZ_CP040506.1\|WP_006778449.1\|4007850_4008801_+\|ABC-transporter-ATP-binding-protein	gnl\|CDD\|224054	COG1131, CcmA, ABC-type multidrug transport system, ATPase component [Defense mechanisms].	7.19847e-100

>NZ_CP040506.1|WP_006778451.1|4009829_4010663_+|deoxyribonuclease-IV
MLTVGCHLSSSKGYLSMGKEAVKIDANTFQFFTRNPRGGKAKDLDVQDVESYLEFAREHGIERILAHAPYTLNACSADEGLREFARNTMEDDLRRLEYTPGNCYNFHPGSHVKQGVEVGITYIAQMLNEILKPEQTTTVLLETMSGKGSEVGRNFEELREILDRVELDSHMGVCLDTCHVWDGGYDIVNHLDEVITEFDRIIGLDRLKAIHLNDSMNPLGAHKDRHAVIGGGHIGEEALVRVINHPALKHLPFYLETPNDLDGYAREIALLRKLWYD
>NZ_CP040506.1|WP_006778450.1|4008790_4009684_+|ABC-transporter-permease
MKINPVYKRETMVSSRSFRMSLIVLVFNSVLAVVALLSMYSVIARVKVTAEIRYSSFLELYTFVATMEFIMLMFIIPAITAGSISGERERQTLELMLTTKMTPAEIVLGKLFSSLSTVAMLIISSFPVLALVFIYGGVRIPDVGMLLLCYVTTAFLAGCLGICFSSIFKRSTLATVVSYCVIILLVAGTYAANRFALSLSQATVDTYLVNVESMAQQANSGGLLYLMLLNPAVTFYVTINGQVGNDQVVNNITRWFGERPANVVTENWNLFSIGVQLALAVLFLWIAIRKVNPRKKK
>NZ_CP040506.1|WP_006778449.1|4007850_4008801_+|ABC-transporter-ATP-binding-protein
MLKIENLKKTYGKVSALDGLNMNIGESSLYGFVGPNGAGKTTTIKIITGLLLPSSGTVTVNGVDAVREPEKLKESIGYVPDFFGVYDNLKVSEYMEFFASCYGLDGLKARKRYMELLGQVGLDEKVDFYVDGLSRGMKQKLCLARALIHNPSLLIMDEPTSGLDPRTRYEFKEILKELREQGKTVLISSHILSELSEICTDIGIIEQGKIVLEGNMEEILSRINTSNPLIISVFGGRETAMTILKSHPLVETITIREEDIVVGFTGDKQDEANLLAQLVDADVLVYGFVRERGNLESVFMQITDHEEDEVVLIHEN
>NZ_CP040506.1|WP_034857837.1|4005397_4007851_+|hypothetical-protein
MKKTKRWAAGLMLLALLVFHVFPAWAVEESSTQTPLIESKITMDVNYGYDNTAKGGRYIPVEVALHNTEEEAFDGQLQVLTMESDYNIYRYDYPVYIEGGASVDKMMDIPLGNRIDQLFINLVDGAGNQVIHKRVKLNVSSEVPELFIGILSDTPEKLQYINGVGVDYSMLRTRTFVMDEENFPEDEIGLNLVDVLLISNYRIRDLSEMQSQALVEWVRSGGIMILGTGARVDDTLGRFAPELLDESYDAPELVQVDMAQDFEAEGPGNAVLEMVCADFSLSGANVIFSDDQLALLATVAYGKGTVAVAAYDFVDIAEFCQRNPSYIDALFTNVLGEDKINRLAESAYSGNSNQYWSANNMINTGNVDRLPDIPLYTMEIIIYIFLVGPGIYIFLRQRELNRYYRSAIVLLSLTFTAIIYLMGSRTRFQDTFYTYARFLDTSEDTVNETTYLNIQTPYNNPYTMKLDPRYSIKPITRSYYDNMSSIPKFTGNEDYKVAIRYEADATTVSAQNVIAFEPKYFQLDKMEANVKGIGFTGTIVMFEDEVTGSVTNSFKEPVEDAALLFYDKMILLGDMEPGETKKLDDLELLQVPLAHNNQIAEKITGKDQYEKPDINSRDYMDALTRTNLLICYLDNSVTSYTTNARVVGIINQPEDDPLHLDTYEVEGITVVSSSIPVYQDEDGVVYRSALMRKPTVISGSYYNMSNTLYGIDPLTIEYSLGNDIEVEKLYIRYVSESFTETASAGSLTPFTGSIYFYNHNTGNYDKMNERQLMYTREQLDDYLSPGNTIMVKYLYSNVSEYSWDILLPMLDIVGREY
>NZ_CP040506.1|WP_138669841.1|4004266_4005391_+|HAMP-domain-containing-protein
MSRRFRTRVITNIMYSTVITCLVEVFLVTNLSMLGNYALKAGRDTSFLAMFANAGSLVTIVYVLIGIVMFAITFLLMQEKSIRYIDRISAAMQNISEGDLNTTVEVIGDDEFSGMAANLNKMVEDIRELMDKERESERTKNELITNVAHDLRTPLTSIIGYLELLSGPAQMSPEMQKKYIDITYTKAKRLEKLIEDLFGFTKLNYGKISMKISKVDIIKLLSQLLEEFYPNFEEKNLSYELQSNVPAKVISADGNLLARLFENLVGNAIKYGADGKRILVRVHATEQIVTVSVTNYGYVIPKDELPMIFDKFYRVEQSRSTNTGGTGLGLAIAKNIVDMHGGTIGVTSDLNGTVFTVRLQVNFDINKENFGKLG
>NZ_CP040506.1|WP_006778445.1|4003560_4004265_+|response-regulator-transcription-factor
MSQINILVVDDEKEIAELVEIYLVSDGYKVFKANNAQEGLDILEKEDIHMVLLDIMMPGMDGLEMCKKIRETNNIPIIMLSARSTDLDKILGLGTGADDYVVKPFNPLELTARVKSQLRRYTQLNPNSGSQETEKNEIAIKGLVINKDNHKVLVYDEEIKLTPIEFDILYLLASNPGRVFSTDEIFEKVWNEKVYEANNTVMVHIRRLRGKMKEDSRQNKIITTVWGVGYKIEK
>NZ_CP040506.1|WP_006778444.1|4001232_4003371_+|RNA-degradosome-polyphosphate-kinase
MAELNAYYTKTENYVNRELSWLEFNYRVLSEARDKNLPLFERLKFLSITASNLDEFFMVRVASLKDMVHAGYTKPDLAGLRASEQLVKIGEKTHEFVNMQYSTYNRSLVPTLRQNGLRIVEHHEELTEAEAGYVDEYFEENIYPVLTPMAVDSSRPFPLIYNKSLNIAALLQKKDGEGDLDFATVQVPKGLPRIVEIPSSGKERVVILLEEIIERNIHSLFLNYNIISAHPYRIMRNADLTIDEEEAEDLLVEIQKQLKKRQWGEAIRLEIEEKTDKRLLKRLKKELELGSDDIYEISGPLDLTFLMKMYGLSGFEELKTPKYMPQQNPAFMNDDDIFANIRKGDILLHHPYESFQPVVEFIQKAAKDPEVLAIKQTLYRVSGNSPIIAALAEAADNGKQVSVLVELKARFDEENNIIWAKMLEKAGCHVIYGLLGLKTHSKITLIVRREEDGIRRYVHLGTGNYNDSTAKLYTDCGLFTCHPQIGEDATAVFNMLSGYSEPLHWNQLIVAPIWLRKRFTRMIRREAENARAGKTARIIAKVNSLCDRDIIGTLYEASCAGVQIDLIVRGICSLKAGVPGLSENIRVRSIVGNFLEHSRIFYFENDGAPEIYMGSADWMPRNLDRRVEITFPVLDEELKQKVLHILQVQLDDNVKAHILMPDGTYEKIDKRGKALVNAQDTFCEEAVQAVKDELDRRDPVSNRVFVPIESHN
>NZ_CP040506.1|WP_006778443.1|3999684_4001229_+|HD-domain-containing-protein
MATHIFAAIDVGSFELELGIYEISTKNGIRQIDHLRHVIALGKDTYNTGKISYELVDEMCQILAGFKSVMDTYRVEAYRAYATSAMREAKNNQIILDQILVRTGIEVEIISNSEQRLLSYKAIAVKETEFSKIIQKGTAIVDVSFGSVQISLFDKDALVSTQNMKVGVLRLRELLNRIQAETRVQYSLVEELVDNELITFKKIYLKDREIKNIVGIGESILYLFRAAGGSEVQKVEKIGIAEFKKFCERLVTLPVSQIEDEFGVNADYATLLVPSALIYKQILEMTGAEMLWIPGIRLCDGIAAEYAEKIRLVKFGHGFEDDILAASRSMSKRYRCHTSHIQNIEGFAVKIFDSMKRFHGLGERERLLLRIATILHDCGKFVSMSNPSQCAYNIIMATEIIGLSHREREIIANVVRYNTAEFDYNQVHVENGDAEGATILVAKLTAMLRLANAMDRSHKEKMENCKLAVKENQLVISTSYEGDLSLEMIAITQKADFFEEIFGIRPVLKQKRRV
>NZ_CP040506.1|WP_006778442.1|3998241_3999540_+|ATP-binding-protein
MNTKQLIIYRDFQYQRLFDDMTLLLGRDENACDGTMPDSFSCASQLIELAAVYGFEGNLWHCFLALCVANHENAYSTACEIRGAVDGTLNNLALQDFRILKQIFDYDITTLNRFTDGSELWNYLAAYKAADGGVGKVFNKRIRDRIIELSLSLAKAESAEEFQDTTTEFYKEFGVGKFGLNKAFRIVEEKGKACIEPIVNVEHVYLDDIIGYELQKQKLIANTESFIQGKAANNVLLFGDAGTGKSSSIKAILNEYYNQGLRIIEVYKHQFHALSSVLEQVQDRNYRFIIYMDDLSFEESELEYKYLKAIIEGGLGRKPKNVLIYATSNRRHLIREKFSDKRELDDELHVNDTVQEKLSLVARFGVTIYFGAPDKKEFQNIVKLLAEKYHVEMPVEELYAEANKWELNHGGLSGRTAAQFITHLLGLPENYG
>NZ_CP040506.1|WP_080568845.1|3997172_3998228_+|prephenate-dehydratase
MALCGEVAHHKIETNKPVYDKAREAEKISAARAQVDTEFEKQAVEEIFTQLMAISRRYQYQLLEQNGKSIQTGFRPVPSLPMTGIKVVYQGVEGAYSHAATLQYFGDNVDAFHVKTWEDAMKAVEDGQADYAVIPIENSSAGAVSDNYDQLIKHSNVIVAEIQISVSHALLGLPGAAESDIQSVYSHPQALMQCSEFLNSHREWRQISVENTAVAAKKIIEDNDITQAAVASETAGRLYGLTTLHPSINHNKDNTTRFIILAKEHIYRQDAGKLSICFELPHKSGSLYNMLGNFIYNGVNMVMIESRPIQGRNWEYRFFVDIEGNLSDASVQNALKSISEEASNMWILGNY
>NZ_CP040506.1|WP_006778453.1|4012005_4013037_+|hypothetical-protein
MATVSYKCPNCGGGLVYEPESGQYQCEYCLSEFTQQKLEEMTPQMDSSQSGETAAAMLYHCPSCGAEIVTDETTAATFCFYCHNPVVLSGRLEGQYHPDYVLPFAVDREKAVEIFTDWVQKKRYVPKSFFSKEQIEKMTGVYFPYWLYSCKVDGTMEAEGVKLRTWIAGNLQYTETQKYEIRRDGHMNINRVPRNALKKADRQLVEGVLPYDMKELRPFSMGYLSGFMAEKRDMEREAFVSELSREVTDFAVTGLQNSVSGYEKVSVRNRQADIRDEKWQYALMPVWTLTYRDNSGKICYFACNGQTGKVCGQLPVDMGRLMILFAEVFLPLLAVLLVVGYLL
>NZ_CP040506.1|WP_138670257.1|4013081_4013978_+|TPM-domain-containing-protein
MVSVFVCIVAAMAFCLMWSGGAWADTTDVSGAAGRVDASDGRRVYDMAGLLTEDEIAGFEQTIGEYRDRMKLDIVVVTTEDSEGKSAMEYADDFFDYGGFGYGRLKNGVLFLIDMDNRELYVSTSGDVIRLLTDSRIESILDDVYVGAGRSDFADSVDAFLKDMDQYYRMGIESGQYNYDTETGRISIHRSIRWYELLLALAVSGFVAGSVCMGVVNRYGMKKERRQAANYLMAYRADCRFEYQNQTDNLVNKFVTTAIIPRQQNHSGGGSSGGSHSGRSSTHSSSSGRSHGGGGRKF
>NZ_CP040506.1|WP_006778455.1|4014037_4015867_-|ferrous-iron-transporter-B
MEEHQHVIALAGNPNVGKSTIFNGLTGMHQHTGNWPGKTVASARGEFQVGEETYELVDLPGTYSLAAHSEEEEIARDFICSGEAQLTIVVCDATCLERGLHLLKQILALEYVKDNGVPVILCVNLCDEAGKKGIEIDFELLQDVLQLPVVSCCARCSKELTVLKDAIHETYGHALNYSCLDFSPKRLAEEVVRYTKVNYRKREDTIDRIVTGRITGGLVMILMLLAVFWLTMAGANYPADLLWDGLFWLESRIANGLAYIGAPQMMIDVLVYGIYRVLAWVVAVMLPPMAIFFPLFTLLEDLGYLPRVAFNMDRSFKRCKACGKQCLTMAMGFGCNAAGVIGCRIIDSPRERMIAILTNAMVPCNGRFPTLFTMITLFFLAGVHGSVTGSILSALILTGVILLGVAATLGASWLLSHTLLKGVPSSFTLELPPYRRPQIGKVVVRSIFDRTLFVLGRAVAIAAPAGLIIWILANINVGGQSILLYLTSFFDPFGRLMGLDGVILVAFILGFPANEIVIPIILMAYLQTGHLVEMNDSSALLQLLVSQGWTWKTAVSMLIFCLFHWPCSTTCLTIRKETGSWRWTAVAFLMPTILGIGLCIAVTAILNLF
>NZ_CP040506.1|WP_006778456.1|4016281_4016584_+|hypothetical-protein
MKQYWTWRGKYIGVRQGDYLVTYGGNVLGKFYGQELYNQEGHYIGEIGRNERMFRDVTKNGFRRPIFSYGVKGSISPCYRDCSAYPLLAGQEDFVFTEDK
>NZ_CP040506.1|WP_006778457.1|4016814_4018092_+|serine-dehydratase-subunit-alpha-family-protein
MEKTNERYNAYIQILKEELVPAMGCTEPIALAYAAAKAREVLGEMPDRVLVEASGSIIKNVKSVIVPNTNHLKGIPAAATAGIIAGKAERELEVIAEVTPEEINQMKEFLETVPIDVKHIDQGITFDIVVTLYKGGSYAKVRIANYHTNIVLVEKDHRILSQKPVEGESEEGLTDRSLLDMEHIWDFINTVDVADVKEVLDRQIAYNTAISEEGLRGNYGANIGQVLLDTYGDDIRTRAKAKAAAGSDARMNGCELPVVINSGSGNQGITTSVPVIEYAKELNVGEEKLYRALALSNLTTIHQKTLIGRLSAYCGAVSAGAGAGAGIAYLCGGDYKDVVHTVVNALAIVSGIVCDGAKASCAAKIASAVDAGILGYNMYKRGQQFYGGDGIVTKGVEATIKNVGRLGKEGMKETNEEIIKIMIGE
>NZ_CP040506.1|WP_006778458.1|4018095_4019289_+|dicarboxylate/amino-acid:cation-symporter
MKKLSQSLPFRLVLGVVIGIIIGQIANTPVMNVVVTVKYILNQMIVFCVPLIIIGFIAPSITKLGNNASKMLGVAVTIAYVSSLGAALFSMIAGVILIPHLSIVTEVEGLKDLPPIVFQLDIPQIMPVMSALVFSLLLGLAATWTKAKVITTVLDEFQKIVLDIVTKVVIPILPIFIAFTFCALSYEGTITKQLPVFIQVVIIVMVGHYIWLALLYFIGGAYSGKNPMNVVKNYGPAYITAVGTMSSAATLAVALRCAKKSEPTLRSDMVDFGIPLFANIHLCGSVLTEVFFVMTVSKILYGSVPSIGTMVLFCALLGVFAIGAPGVPGGTVMASLGLITGILGFDEMGTALMLTIFALQDSFGTACNVTGDGALTMILTGFAEKHNIKKQEIKIDL
>NZ_CP040506.1|WP_006778459.1|4019432_4019723_-|helix-turn-helix-transcriptional-regulator
MIADRIRILRQRNNWSQTDLANKLGITRSSVNAWELGISVPATKTVVELAGIFHVSADYILGISTDSDTINLEGYTDREKAIIYNLLNYFLEEHGR
>NZ_CP040506.1|WP_006778460.1|4019917_4020172_+|hypothetical-protein
MDTDVKNGLIQLKDKLENEAGQANELYRCLILAEYGIEYMDGDSRETEAAALQAFSRLAGILAGQLKENVEFVTLLIKQVEKTV
>NZ_CP040506.1|WP_034857842.1|4020382_4021315_+|WYL-domain-containing-transcriptional-regulator
MLKGAKSDLKCDRILSMYTRLLRGEIIYKKELADEFHVNARSVQRDLDELRNFFSEQRLKDGNDQDLIYDQKHKGYRLVQAGEETLNNSEIFAICKILLESRSLVKKELFPIMDKLLALCSTEKERKKLFDLVANEKWHYIELQHGKKLLKNIWEISNAIYEKYCMEIKYRRQGEAETVQRTVKPVGIMFSEYYFYLTAFIKEEKHAEDVYPTIYRIDRIEEFKILSEHFNLPYASRFEEGEFRKRIQFMYGGKLRKVKFRYNGPSIEAVLDRLPTAQYVEEGGGEYTVSAEVYGDGIEMWLRSQGTFIT
>NZ_CP040506.1|WP_006778464.1|4022880_4023234_+|hypothetical-protein
MKEELIASLKQQIFFKEEDSIYFVYDIKNMTFLQLRDRLMGNGKILSEDFEHHIYIVQVMSGMANMNPAYLAIKLDDKKVYFIGYAKEGIIKQHIAQKAIDKILSLLITSGDDVFCM

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP040506_6

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP040506_6

4525984-4526121

Orphan

Consensus_repeat	Method
ACAGCAGCCAGAACAGCA	CRT

3 spacers

The CRISPR arrays of NZ_CP040506_6

>merge|NZ_CP040506|6|4525984-4526121|CRT
AGAGATGTCAGAACAGCAATCAGAACAACAGCCAGAACAGCAGCCAGAACAGCAGCAGAAACAACAGCCAGAACAGCGGCCAGAACAACAGCCAGAACAGCAGCAGAAACAACAACCAGAACAGCAGCCAGAACAGCA

>NZ_CP040506|6|3|4525984-4526121|CRT
AGAGATGTCAGAACAGCA	ATCAGAACAACAGCCAGA
ACAGCAGCCAGAACAGCA	GCAGAAACAACAGCCAGAACAGCGGCCAGA
ACAACAGCCAGAACAGCA	GCAGAAACAACAACCAGA
ACAGCAGCCAGAACAGCA

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP040506.1\|WP_006778904.1\|4534613_4535756_+\|GGDEF-domain-containing-protein	unknown	unknown	gnl\|CDD\|143635
NZ_CP040506.1\|WP_006778896.1\|4526649_4527192_+\|phosphodiesterase	unknown	unknown	gnl\|CDD\|181869
NZ_CP040506.1\|WP_006778886.1\|4518310_4518811_+\|DUF1700-domain-containing-protein	unknown	unknown	gnl\|CDD\|227053
NZ_CP040506.1\|WP_138669894.1\|4532663_4532960_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP040506.1\|WP_006778892.1\|4523703_4524717_+\|ABC-transporter-ATP-binding-protein	unknown	unknown	gnl\|CDD\|226361
NZ_CP040506.1\|WP_006778900.1\|4530419_4530905_+\|metallophosphoesterase	unknown	unknown	gnl\|CDD\|223695
NZ_CP040506.1\|WP_006778899.1\|4529811_4530423_+\|RdgB/HAM1-family-non-canonical-purine-NTP-pyrophosphatase	unknown	unknown	gnl\|CDD\|234648
NZ_CP040506.1\|WP_006778889.1\|4520898_4521999_+\|ABC-transporter-substrate-binding-protein	unknown	unknown	gnl\|CDD\|270267
NZ_CP040506.1\|WP_006778890.1\|4522059_4522905_+\|ABC-transporter-permease-subunit	unknown	unknown	gnl\|CDD\|226616
NZ_CP040506.1\|WP_006778893.1\|4524735_4525722_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|224305
NZ_CP040506.1\|WP_034858771.1\|4526226_4526535_+\|rhodanese-like-domain-containing-protein	unknown	unknown	gnl\|CDD\|238089
NZ_CP040506.1\|WP_006778903.1\|4533411_4534578_+\|GGDEF-domain-containing-protein	unknown	unknown	gnl\|CDD\|143635
NZ_CP040506.1\|WP_006778891.1\|4522906_4523701_+\|ABC-transporter-permease-subunit	unknown	unknown	gnl\|CDD\|224098
NZ_CP040506.1\|WP_006778887.1\|4518982_4519693_+\|C40-family-peptidase	unknown	unknown	gnl\|CDD\|223862
NZ_CP040506.1\|WP_006778885.1\|4516238_4518176_+\|fructose-bisphosphatase-class-III	unknown	unknown	gnl\|CDD\|377726
NZ_CP040506.1\|WP_006778901.1\|4531868_4532249_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|376229
NZ_CP040506.1\|WP_006778884.1\|4515332_4516139_-\|MBL-fold-metallo-hydrolase	unknown	unknown	gnl\|CDD\|224155
NZ_CP040506.1\|WP_080568850.1\|4528397_4529717_+\|peptidase-C1	unknown	unknown	gnl\|CDD\|375986
NZ_CP040506.1\|WP_050810052.1\|4527247_4528375_+\|class-I-SAM-dependent-RNA-methyltransferase	unknown	unknown	gnl\|CDD\|223194
NZ_CP040506.1\|WP_138670285.1\|4519965_4520661_+\|C40-family-peptidase	unknown	unknown	gnl\|CDD\|223862

Protein	Function_ID	Function_description	E-value
NZ_CP040506.1\|WP_006778904.1\|4534613_4535756_+\|GGDEF-domain-containing-protein	gnl\|CDD\|143635	cd01949, GGDEF, Diguanylate-cyclase (DGC) or GGDEF domain. Diguanylate-cyclase (DGC) or GGDEF domain: Originally named after a conserved residue pattern, and initially described as a domain of unknown function 1 (DUF1). This domain is widely present in bacteria, linked to a wide range of non-homologous domains in a variety of cell signaling proteins. The domain shows homology to the adenylyl cyclase catalytic domain. This correlates with the functional information available on two GGDEF-containing proteins, namely diguanylate cyclase and phosphodiesterase A of Acetobacter xylinum, both of which regulate the turnover of cyclic diguanosine monophosphate. Together with the EAL domain, GGDEF might be involved in regulating cell surface adhesion in bacteria.	2.06463e-43
NZ_CP040506.1\|WP_006778896.1\|4526649_4527192_+\|phosphodiesterase	gnl\|CDD\|181869	PRK09453, PRK09453, phosphodiesterase; Provisional.	7.36923e-98
NZ_CP040506.1\|WP_006778886.1\|4518310_4518811_+\|DUF1700-domain-containing-protein	gnl\|CDD\|227053	COG4709, COG4709, Predicted membrane protein [Function unknown].	1.42925e-09
NZ_CP040506.1\|WP_006778892.1\|4523703_4524717_+\|ABC-transporter-ATP-binding-protein	gnl\|CDD\|226361	COG3842, PotA, ABC-type spermidine/putrescine transport systems, ATPase components [Amino acid transport and metabolism].	2.5035e-139
NZ_CP040506.1\|WP_006778900.1\|4530419_4530905_+\|metallophosphoesterase	gnl\|CDD\|223695	COG0622, COG0622, Predicted phosphoesterase [General function prediction only].	2.24026e-36
NZ_CP040506.1\|WP_006778899.1\|4529811_4530423_+\|RdgB/HAM1-family-non-canonical-purine-NTP-pyrophosphatase	gnl\|CDD\|234648	PRK00120, PRK00120, dITP/XTP pyrophosphatase; Reviewed.	1.30372e-90
NZ_CP040506.1\|WP_006778889.1\|4520898_4521999_+\|ABC-transporter-substrate-binding-protein	gnl\|CDD\|270267	cd13549, PBP2_Fbp_like_3, Substrate binding domain of an uncharacterized ferric iron transporter, a member of the type 2 periplasmic binding fold superfamily. The periplasmic iron binding protein plays an essential role in the iron uptake pathway of Gram-negative pathogenic bacteria from the Pasteurellaceae and Neisseriaceae families and is critical for survival of these pathogens within the host. This periplasmic domain (Fbp) has high affinity for ferric iron and serves as the primary receptor for transport. After binding iron with high affinity, Fbp interacts with a cognate membrane transport complex comprised of two integral membrane domains and two cytoplasmically located ATPase. This interaction triggers the ligand translocation across the cytoplasmic membrane energized by ATP hydrolysis. The ferric iron-binding proteins belong to the PBP2 superfamily of periplasmic binding proteins that differ in size and ligand specificity, but have similar tertiary structures consisting of two globular subdomains connected by a flexible hinge. They have been shown to bind their ligand in the cleft between these domains in a manner resembling a Venus flytrap.	2.53313e-43
NZ_CP040506.1\|WP_006778890.1\|4522059_4522905_+\|ABC-transporter-permease-subunit	gnl\|CDD\|226616	COG4132, COG4132, ABC-type uncharacterized transport system, permease component [General function prediction only].	3.56478e-69
NZ_CP040506.1\|WP_006778893.1\|4524735_4525722_+\|hypothetical-protein	gnl\|CDD\|224305	COG1387, HIS2, Histidinol phosphatase and related hydrolases of the PHP family [Amino acid transport and metabolism / General function prediction only].	5.59363e-06
NZ_CP040506.1\|WP_034858771.1\|4526226_4526535_+\|rhodanese-like-domain-containing-protein	gnl\|CDD\|238089	cd00158, RHOD, Rhodanese Homology Domain (RHOD); an alpha beta fold domain found duplicated in the rhodanese protein. The cysteine containing enzymatically active version of the domain is also found in the Cdc25 class of protein phosphatases and a variety of proteins such as sulfide dehydrogenases and certain stress proteins such as senesence specific protein 1 in plants, PspE and GlpE in bacteria and cyanide and arsenate resistance proteins. Inactive versions (no active site cysteine) are also seen in dual specificity phosphatases, ubiquitin hydrolases from yeast and in sulfuryltransferases, where they are believed to play a regulatory role in multidomain proteins.	4.26641e-23
NZ_CP040506.1\|WP_006778903.1\|4533411_4534578_+\|GGDEF-domain-containing-protein	gnl\|CDD\|143635	cd01949, GGDEF, Diguanylate-cyclase (DGC) or GGDEF domain. Diguanylate-cyclase (DGC) or GGDEF domain: Originally named after a conserved residue pattern, and initially described as a domain of unknown function 1 (DUF1). This domain is widely present in bacteria, linked to a wide range of non-homologous domains in a variety of cell signaling proteins. The domain shows homology to the adenylyl cyclase catalytic domain. This correlates with the functional information available on two GGDEF-containing proteins, namely diguanylate cyclase and phosphodiesterase A of Acetobacter xylinum, both of which regulate the turnover of cyclic diguanosine monophosphate. Together with the EAL domain, GGDEF might be involved in regulating cell surface adhesion in bacteria.	1.67351e-47
NZ_CP040506.1\|WP_006778891.1\|4522906_4523701_+\|ABC-transporter-permease-subunit	gnl\|CDD\|224098	COG1177, PotC, ABC-type spermidine/putrescine transport system, permease component II [Amino acid transport and metabolism].	1.62914e-39
NZ_CP040506.1\|WP_006778887.1\|4518982_4519693_+\|C40-family-peptidase	gnl\|CDD\|223862	COG0791, Spr, Cell wall-associated hydrolases (invasion-associated proteins) [Cell envelope biogenesis, outer membrane].	5.72864e-29
NZ_CP040506.1\|WP_006778885.1\|4516238_4518176_+\|fructose-bisphosphatase-class-III	gnl\|CDD\|377726	pfam06874, FBPase_2, Firmicute fructose-1,6-bisphosphatase. This family consists of several bacterial fructose-1,6-bisphosphatase proteins (EC:3.1.3.11) which seem to be specific to phylum Firmicutes. Fructose-1,6-bisphosphatase (FBPase) is a well known enzyme involved in gluconeogenesis. This family does not seem to be structurally related to pfam00316.	0
NZ_CP040506.1\|WP_006778901.1\|4531868_4532249_+\|hypothetical-protein	gnl\|CDD\|376229	pfam18810, PBECR2, phage-Barnase-EndoU-ColicinE5/D-RelE like nuclease2. A predicted endoRNase of the Barnase-EndoU-ColicinE5/D-RelE like nuclease fold found in polyvalent proteins of phages. The predicted active site contains a conserved arginine and threonine residues.	3.33647e-14
NZ_CP040506.1\|WP_006778884.1\|4515332_4516139_-\|MBL-fold-metallo-hydrolase	gnl\|CDD\|224155	COG1234, ElaC, Metal-dependent hydrolases of the beta-lactamase superfamily III [General function prediction only].	6.44259e-32
NZ_CP040506.1\|WP_080568850.1\|4528397_4529717_+\|peptidase-C1	gnl\|CDD\|375986	pfam18560, Lectin_like, Lectin like domain. This is a lectin like domain found in Cwp84, a surface-located cysteine protease (a member of the C1A cysteine protease family, also known as papain proteases) responsible for the maturation of the SlpA precursor protein which has been implicated in the degradation of extracellular matrix proteins such as fibronectin, laminin and vitronectin. Structural comparison indicates that this domain is similar to carbohydrate-binding domains.	4.19761e-77
NZ_CP040506.1\|WP_050810052.1\|4527247_4528375_+\|class-I-SAM-dependent-RNA-methyltransferase	gnl\|CDD\|223194	COG0116, COG0116, Predicted N6-adenine-specific DNA methylase [DNA replication, recombination, and repair].	2.879e-141
NZ_CP040506.1\|WP_138670285.1\|4519965_4520661_+\|C40-family-peptidase	gnl\|CDD\|223862	COG0791, Spr, Cell wall-associated hydrolases (invasion-associated proteins) [Cell envelope biogenesis, outer membrane].	1.63231e-28

>NZ_CP040506.1|WP_006778893.1|4524735_4525722_+|hypothetical-protein
MKRNIEGFKGRGNWYKGNLHSHTVNSDGKLTPAESVKLFQDNGYHFLCLSEHDLYTDYRKEFDSPEFIILPGLEASAVLFEKEDGIHRKKVHHIHGILGTELMQQKAVKPLFRHMERLEVPVYYGEWDGAAVAQQLADELAARGCITTYNHPVWSRVEEREFVDTDGIFGLEIFNYNTVNESGTGYDTAHWDVMLRKGRRIHGFASDDNHNEGLFDDACGGYVWVKADGLTHDNIISALVEGNYYSSSGPEIYDWGIREGVVYVDCSPVNRVNVIAGGYVNGGRTVMCGSLQETMTRAEYPLNGDETYVRVECVDASGRTAWSNAIFL
>NZ_CP040506.1|WP_006778892.1|4523703_4524717_+|ABC-transporter-ATP-binding-protein
MAYIEFRNITKMFGDNRVLDEITMEVQKGDLVTLLGPSGCGKSTLLRCLSGLESVTEGQIFLDGEDITETPPSQRNVGMVFQQYSLFPNMTVEQNIAFGLKMKKAAPELIDEKVRGAIRMVELEGKEKSYPANLSGGQQQRVALARSIVMEPKVLLLDEPLSAIDAKLRKSLQSSIRQIHKELGLTTIFVTHDQDEAMVMSDVIQLFHAGKIEQSGSPIAMYTEPKTKFAAGFIGNYNILTASEFIRVTGKPYEASEDVAIRPETISVSRTVKDVANAYHFEGIIKNNTPRGNVLRYDIDVNGVMLKADVLFRSFQLYENGSRVQLAVENHNCLALK
>NZ_CP040506.1|WP_006778891.1|4522906_4523701_+|ABC-transporter-permease-subunit
MKKSKRLPQLLIILISIYLLIPFVVTFIYSLSTEWVGIIPSGFTVKNYVELFQDMDFWLSVGRTLVICVVSVSISIALLLGVMFVVTMYAPWLGKYIQFICMIPYALQGVILSISIVSLFSGTGTFLSNRMMMLFGAYSIMVLPYIYQGIRNNLNAINSKMLVDAAQMLGAGRLYAFFRVVIPNIMPGVIVSSLLAVSIVFGDFVLANNIAGNNYQNIQVYLYVNMTKSSSKASAIVVLIFVVVFGITGTVLWLQNKGKKVAGR
>NZ_CP040506.1|WP_006778890.1|4522059_4522905_+|ABC-transporter-permease-subunit
MNIKKQTWKNCLVLLPFAIVVCLYELLPLLQLALNSFHDENTGAWSLSNYGKIFSTPLYQASIVNSIRISLISALVGICVAFIAAKSYHDAGEKFQNFFTMVLNMTSNFSGVPLTFGFMILLGNTGVLTLVAQKLGFLQDFNLYSGNGLTLIYIYFQIPLATLLLIPAFLGIKKEWREAAILLHCGSLRYWFLIGIPNLLTSLLGTLSVLFSNALAAYATAYALLLSNYALLPLQISSKFKGDVRINKELGGALSVVMICLMVAATLVNNYLTKKHAKGAA
>NZ_CP040506.1|WP_006778889.1|4520898_4521999_+|ABC-transporter-substrate-binding-protein
MKKSCVSVLLAMSMAAALLSGCAKSAAAENVDYNSKGWDAIVADAKKEGKVNSVGMPDTWANWIGTWQGINDEYGIAHEDLDMSSSEEIALFKEEGKDGTKDIGDVGQQWGPVAESEGVTLKYKTSYWDDIPSWAKDDDGDWIVCYVGTISIITNNALVDKAPQSFQDILEGDYKVTIGDVSAASQAQHAILATAYAMGGDMDNLQPAYDFWSTLAKEGRIDTGDTSTARIESGEIAVGLFWDYNALNYRDNAVSNNPNASFTVCVPSDGSVQSGYASIINVNAPNPNAACLAREYILSDQGQINLAIGYATPIRSNVVIPAEVQAKRIDQSQYASAHAIEDFDKWTNVCQDIITYWEENIIPAIK
>NZ_CP040506.1|WP_138670285.1|4519965_4520661_+|C40-family-peptidase
MFVFASPMEAKASTALAGPGMEGGSYVATVNASTVNINASQNSDVVIAQATQGMSFNVLEDMGDGWLKIKVGSAEGFIPFDESISLQEEMEASDDEASLTVNMNGLEVTTEQRQNLVNYALQFVGGRYKYGGSDPHSGVDCSGFTRYVMANGAGVAMNRSSTAQSTQGVSIALEQIRPGDLIFYGNGSRINHVAMYIGNGQIVHASTYKTGIKVSDWLYRSPVKVVNVLGD
>NZ_CP040506.1|WP_006778887.1|4518982_4519693_+|C40-family-peptidase
MLKTILKAMAAFCVCGFFLGAAPDTSYGAVKESTCVGVETSSSYLVKIDAPSARIYTGKSTSAAVADTVQRGQTYDVISYQNGWVKINTGKSEGYLKTAGQATVVETAREKVDEAAAVRAQVVDFALQFVGNPYVYGGTDPNTGADCSGFTSYVLRHAAGVSLSHSSVAQAGEGRVVSEEEMKQGDLVFYSNGFRINHVAIYAGNGQVVHASTNKTGIKTSPWNYRTPVKIVRVLP
>NZ_CP040506.1|WP_006778886.1|4518310_4518811_+|DUF1700-domain-containing-protein
MNKEEFLRRLRQALAGDVPPGVIEENIRYYDSYISGEVRKGQSEEEVIAAIGDPRLIAKTIEETTEGAGEGSYTDADDRSGYGSYERNPYEKNTYERNPYETNRSFHMIDLNKWYWKLLAVVLVFSIISLIITVVGGIFTLLAPLIGPLFLIWMVVWIFRMFNNRR
>NZ_CP040506.1|WP_006778885.1|4516238_4518176_+|fructose-bisphosphatase-class-III
MRELAYLKLLSREYPTIKAASSEIINLTAIRGLPKGTEYFFSDLHGEHEAFIHLLRSSSGIIREKIKETFGYIIPEEEQVELANLIYYPDQVLNQIGASGKDTDDWKRINIYRLVQICKEVSSKYTRSKVRKKLPPEFAYIIDELIHVDYNADNKRVYYSEIIRSIIDIDVADKFIIALCELIQNLTVDNLHIIGDIFDRGPRADLIMNELMHFHDVDVQWGNHDISWMGAATGNLACICNVLRIAISYNSFDVLEDGYGINLRPLSMFAASTYRDDECARFVPHILDQNIYDAVDPGLAAKMHKAIAVIQLKVEGQIIKRHPEYRMDDRLLLEQVDGKKGTVCIGGKEYPMLDMKFPTIDWEDPLKLSEDEVELLHTLSLSFRHSDLLHKHVKFLYSHGALYKSYNKNLLYHGCIPMKKDGSFDTMVFNGVSYSGKSLMDFVDRMIQNAYFLKGESKEKEDARDFMWYLWCGEKSPVYGKDKMTTFEHYFVADAATHKETMNPYYQLSVKEEYCDKILEEFGLPTKGAHIINGHVPVKIKDGETPVKAGGKLYIIDGGLSKAYQSKTGIAGYTLIYNSNHLALAEHKPFTPGKENTPKVTIVEKMKNRVMVGDTDLGKELAGRIEDLKELVAAYREGVIKEKMV
>NZ_CP040506.1|WP_006778884.1|4515332_4516139_-|MBL-fold-metallo-hydrolase
MEQLYVFGTGNAIVTRCYNTCFAIKNSDGEYFMVDTGGGNGILRILEDMNVDMKRIHHIFLTHEHTDHLLGIVWLVRMISVLMKKELYDGNLYIYCHEDLVETVTTVCRLTLQPKFFKAIGDTIHLVAVKDGETRQILNWPVTFFDIHSTKAKQFGFTMTLEQGRRLTCAGDEPYNPLCEKFVAGSDWLLHEAFCLYGDRERFNPYEKHHSTVKDACQLAEELHIPNLVLWHTEDKSLDTRKETYMAEGTQYYHGNLFIPYDGEILEL
>NZ_CP040506.1|WP_034858771.1|4526226_4526535_+|rhodanese-like-domain-containing-protein
MYQTITMKQLEQMLDCHEDIFLLDVRNRASYEMCHMEGAVNIPCEELDEKMESLPKDKTIVCYCARGGQSMLACNHLSAMGYSVVNTANGLSSYRGKYLVKG
>NZ_CP040506.1|WP_006778896.1|4526649_4527192_+|phosphodiesterase
MKYMFASDIHGSACYCRKMLEIYRQSGAGRLILLGDILYHGPRNDLPEEYAPKLVTEMLNQYKDQIYAVRGNCDAEVDQMVLEFPIMADYALLELNGKTFYATHGHIYNQDCLPPMQAGDVLIHGHIHLPVAEKMGDKFLLNPGSTSLPKEGNPNSYAMLDGEIFTIYDFDGNKVKEIAL
>NZ_CP040506.1|WP_050810052.1|4527247_4528375_+|class-I-SAM-dependent-RNA-methyltransferase
MEAVLKREIIDLGYEISLVEDGRVTFVGDDEAICRANIFLRTAERVLLKVGSFRAESFEELFQGTKAIAWEEYIPQDGKFWVAKASSIKSKLFSPSDIQSIMKKAMVERMKKAYGLERFPETGSSYPLRVFLYKDMVTVGIDTSGDSLHKRGYRTLTSKAPITETLAAALILLTPWNKDRILVDPFCGSGTFPIEAAMMAANMAPGMKRTFLSEDWKNLIPRKCWYEAMDEANEMVDDTVEVDIQGYDIDGEIVKAARANAEAAGVGHMIHFQQRPLSALSHPKKYGFLITNPPYGERIEEKENLPALYREIGERFRALDSWSAYMITAYEDAEKYMGRKADKNRKIYNGMMKTYFYQFLGPKPPRRKAGDEIET
>NZ_CP040506.1|WP_080568850.1|4528397_4529717_+|peptidase-C1
MLVILLSTASAWSMGKTGDPAVVAVDGTRVYYPVYALDKTRVAPLLPSSYDYRKEGRAPKVKDQGNYGTCWAFASLTALESALMPGEKMDLSEDHMSLQNGFNLTQDDGGEYTMSMAYLLGWQGPVYEKDDPYGDGVSPQGLKPVKHVQEIQILPQKDYQKIKAAVYFRGGVQSSLYTSIKNYKSRSVYYNENTFSYCYIGDEKPNHDAVIVGWDDNFPKENFNMELPGDGAFLCASSWGTAFGDGGYFYVSYYDSNIGMHNILYTGVESVDNYDRIYQTDLCGWVGQLGYGKESAYGANVYQAGERENLEAVGFYATDVNTEYEVYVSRHVPETPDFAERELAASGKFENAGFYTVKLDTPVELDAGERFGVMIKITTPGSVHPVAIEYQADNTLSLVDISDGEGYISFRGTSWESMEEKYGCNLCLKAYTSVRDGAS
>NZ_CP040506.1|WP_006778899.1|4529811_4530423_+|RdgB/HAM1-family-non-canonical-purine-NTP-pyrophosphatase
MGHKIVFATGNEGKMKEIRLILADLGLEILSMKEAGVDLDIVEDGKTFEENAAIKARAVWEKTGGIVLADDSGLVIDYLDGEPGIYSARYLGEDTSYECKNRVILERMEKAQGEERSARFVSAIAAVLPDGRELGTLGIVEGVIAGEPAGDGGFGYDPIFYLPEFGMTSAEIPIELKNEISHRGKALVAMKDKIRKVFEEEHR
>NZ_CP040506.1|WP_006778900.1|4530419_4530905_+|metallophosphoesterase
MKILVVSDTHRKDDGLKMVIEKEKPLDMLIHLGDAEGSERYIAEWVNPECRLEMVLGNNDFFSMLDKEREIKIGKYRALLTHGHYYGVSMGAEGLAEEARNRGCGMALFGHTHRPYYGKIGGVVVINPGSLSYPRQEGKKGSYGIMTVTDEGEVEYSQNFL
>NZ_CP040506.1|WP_006778901.1|4531868_4532249_+|hypothetical-protein
MRTVGRIDRSIYSCVADDIVTDEVIITEERIAHIAERHPGDYERFCQCLKEVVERPDFIVETQKPNTALLLKELAELDGKKFKTILRLMTSREKSDYKNSIITFMKIDEKEWNRLIRNKKIIYKRE
>NZ_CP040506.1|WP_138669894.1|4532663_4532960_+|hypothetical-protein
MQRGRELDVFRQFSVLRDMKEQDLMYQLLCLKECLSQEEEERAEAVRVWRGSILAKRMTREMQNILIALAELEADCESLEEFPTVEEIAARAKTIEVW
>NZ_CP040506.1|WP_006778903.1|4533411_4534578_+|GGDEF-domain-containing-protein
MSRALIHANIYLLPVIVLFIISQDVKKSLPRNLNTHFFIVLVWQTIGMMVLETCSWVPDGEMWEGARMLVWVCNILYAMLYAGFAFSWFVYIYSRIPGVENLLENRKKLRLLSIPVLISCLVLIMTPWTHWVFWVNENNSYERGPYYIAPYLFISGYMLTAIVLSFLQRRRVTRAGEKQECVRLAVYAMIPIAGLVLQLLDYKFWSAWPFTALAILTIYVSMQNGQITTDGLTGLNNRRQLEKYLLSRCDMNDGKLWCLIILDVDDFKSINDVYGHIVGDKVLCRVAKVLKAAYGNTDSFLARFGGDEFVVVASCDGAEKAKDVLQLFYDKLEESNRQAAKPLRVTLSAGYACYDGVRVNDRHSLMKAADEAMYREKQRKKAGDCMPA
>NZ_CP040506.1|WP_006778904.1|4534613_4535756_+|GGDEF-domain-containing-protein
MGRFGYIQINMFAALMLLILYINSKSKFPYSRNSKRFRKIITLMILTLVTDTAIRVFDGQGAAWVSTAMWVCVWLYYAAVDMLAYGWFLFTYANLYEDRDLIEHKWLILFTSAPLLVLVLMMTGWPGLVFGVDGQNHYVRGAAFLLQCFVWAAYILAAGGMAFFLRRKANMREKREEYVYLAYFPVLPLAGGLLQLVVKDMAAIWPFTVASMVMVYVKMQRTQISLDPMTGLNNRSRFNQFIQSKIDGGRNQNPWYLLLIDVDKFKQINDSFGHMAGDAALIKVASVLKRTFGKMNAFIARYGGDEFVVVLECRKEKDILNAMQQLDTMLEHENRHENTPYQLCCSAGYVRFDGEIMKTKEQLIAAADKEMYLQKKSRNA

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP040506_7

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP040506_7

5395628-5395861

Orphan

Consensus_repeat	Method
GTCACAGCTTGCGAAAGCTGTGTGGATTGAAAC	CRISPRCasFinder

3 spacers

The CRISPR arrays of NZ_CP040506_7

>merge|NZ_CP040506|7|5395628-5395861|CRISPRCasFinder
GTCACAGCTTGCGAAAGCTGTGTGGATTGAAACGCTTAAAGGGAACCGGGTCTCATAGGGTGTCAGGTCACAGCTTGCGAAAGCTGTGTGGATTGAAACTCAGTTTTTAATAATTCTTTCATTCCGTCCTGAAAGTCACAGCTTGTGAAAGCTGCGTGGATTGAAACGTTATTAAGTGTACTATCCTTATTTTCATCTTGTGTTGCAGTTTGCGAAGGTCTAGTGGGTTGAAAG

>NZ_CP040506|7|6|5395628-5395861|CRISPRCasFinder
GTCACAGCTTGCGAAAGCTGTGTGGATTGAAAC	GCTTAAAGGGAACCGGGTCTCATAGGGTGTCAG
GTCACAGCTTGCGAAAGCTGTGTGGATTGAAAC	TCAGTTTTTAATAATTCTTTCATTCCGTCCTGAAA
GTCACAGCTTGTGAAAGCTGCGTGGATTGAAAC	GTTATTAAGTGTACTATCCTTATTTTCATCTTGT
GTTGCAGTTTGCGAAGGTCTAGTGGGTTGAAAG

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP040506.1\|WP_138670012.1\|5402536_5404123_+\|transposase	unknown	unknown	gnl\|CDD\|372705
NZ_CP040506.1\|WP_006779650.1\|5390465_5391302_+\|alpha/beta-hydrolase	unknown	unknown	gnl\|CDD\|223669
NZ_CP040506.1\|WP_006779667.1\|5407559_5408966_-\|glucuronate-isomerase	unknown	unknown	gnl\|CDD\|376859
NZ_CP040506.1\|WP_006779657.1\|5397109_5399104_+\|M28-family-peptidase	unknown	unknown	gnl\|CDD\|349868
NZ_CP040506.1\|WP_006779652.1\|5392378_5392999_+\|dihydroxyacetone-kinase-subunit-L	unknown	unknown	gnl\|CDD\|376911
NZ_CP040506.1\|WP_006779648.1\|5387937_5389452_+\|sugar-ABC-transporter-ATP-binding-protein	unknown	unknown	gnl\|CDD\|224053
NZ_CP040506.1\|WP_006779646.1\|5386207_5386708_+\|L-2-amino-thiazoline-4-carboxylic-acid-hydrolase	unknown	unknown	gnl\|CDD\|372958
NZ_CP040506.1\|WP_006779658.1\|5399108_5399744_+\|GNAT-family-N-acetyltransferase	unknown	unknown	gnl\|CDD\|223532
NZ_CP040506.1\|WP_006779649.1\|5389448_5390411_+\|ABC-transporter-permease	unknown	unknown	gnl\|CDD\|224093
NZ_CP040506.1\|WP_034858139.1\|5406766_5407438_+\|helix-turn-helix-domain-containing-protein	unknown	unknown	gnl\|CDD\|238045
NZ_CP040506.1\|WP_006779653.1\|5393159_5393789_+\|GntR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|224715
NZ_CP040506.1\|WP_006779656.1\|5396150_5396879_+\|YebC/PmpR-family-DNA-binding-transcriptional-regulator	unknown	unknown	gnl\|CDD\|234640
NZ_CP040506.1\|WP_006779655.1\|5394488_5395421_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|369649
NZ_CP040506.1\|WP_138670010.1\|5394083_5394461_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP040506.1\|WP_006779651.1\|5391349_5392357_+\|dihydroxyacetone-kinase-subunit-DhaK	unknown	unknown	gnl\|CDD\|376910
NZ_CP040506.1\|WP_006779664.1\|5404389_5405310_+\|aldo/keto-reductase	unknown	unknown	gnl\|CDD\|381318
NZ_CP040506.1\|WP_006779662.1\|5402224_5402422_+\|helix-turn-helix-transcriptional-regulator	unknown	unknown	gnl\|CDD\|238045
NZ_CP040506.1\|WP_006779647.1\|5386750_5387845_+\|sugar-ABC-transporter-substrate-binding-protein	unknown	unknown	gnl\|CDD\|380478
NZ_CP040506.1\|WP_006779665.1\|5405425_5406448_-\|PTS-sugar-transporter-subunit-IIC	unknown	unknown	gnl\|CDD\|379113
NZ_CP040506.1\|WP_006779659.1\|5399830_5400793_+\|Gfo/Idh/MocA-family-oxidoreductase	unknown	unknown	gnl\|CDD\|223745

Protein	Function_ID	Function_description	E-value
NZ_CP040506.1\|WP_138670012.1\|5402536_5404123_+\|transposase	gnl\|CDD\|372705	pfam13751, DDE_Tnp_1_6, Transposase DDE domain. Transposase proteins are necessary for efficient DNA transposition. This domain is a member of the DDE superfamily, which contain three carboxylate residues that are believed to be responsible for coordinating metal ions needed for catalysis.	3.81528e-29
NZ_CP040506.1\|WP_006779650.1\|5390465_5391302_+\|alpha/beta-hydrolase	gnl\|CDD\|223669	COG0596, MhpC, Predicted hydrolases or acyltransferases (alpha/beta hydrolase superfamily) [General function prediction only].	9.3902e-20
NZ_CP040506.1\|WP_006779667.1\|5407559_5408966_-\|glucuronate-isomerase	gnl\|CDD\|376859	pfam02614, UxaC, Glucuronate isomerase. This is a family of Glucuronate isomerases also known as D-glucuronate isomerase, uronic isomerase, uronate isomerase, or uronic acid isomerase, EC:5.3.1.12. This enzyme catalyzes the reactions: D-glucuronate <=> D-fructuronate and D-galacturonate <=> D-tagaturonate. It is not however clear where the experimental evidence for this functional assignment came from and thus this family has no literature reference.	0
NZ_CP040506.1\|WP_006779657.1\|5397109_5399104_+\|M28-family-peptidase	gnl\|CDD\|349868	cd02690, M28, M28 Zn-peptidases include aminopeptidases and carboxypeptidases. Peptidase M28 family (also called aminopeptidase Y family) contains aminopeptidases as well as carboxypeptidases. They have co-catalytic zinc ions; each zinc ion is tetrahedrally co-ordinated, with three amino acid ligands plus activated water; one aspartate residue binds both metal ions. The aminopeptidases in this family are also called bacterial leucyl aminopeptidases, but are able to release a variety of N-terminal amino acids. IAP aminopeptidase and aminopeptidase Y preferentially release basic amino acids while glutamate carboxypeptidase II preferentially releases C-terminal glutamates. Plasma glutamate carboxypeptidase (PGCP) and glutamate carboxypeptidase II (NAALADase) hydrolyze dipeptides. Several members of the M28 peptidase family have PA domain inserts which may participate in substrate binding and/or in promoting conformational changes, which influence the stability and accessibility of the site to substrate. These include prostate-specific membrane antigen (PSMA), yeast aminopeptidase S (SGAP), human transferrin receptors (TfR1 and TfR2), plasma glutamate carboxypeptidase (PGCP) and several predicted aminopeptidases where relatively little is known about them. Also included in the M28 family are glutaminyl cyclases (QC), which are involved in N-terminal glutamine cyclization of many endocrine peptides. Nicastrin and nicalin belong to this family but lack the amino-acid conservation required for catalytically active aminopeptidases.	1.06087e-19
NZ_CP040506.1\|WP_006779652.1\|5392378_5392999_+\|dihydroxyacetone-kinase-subunit-L	gnl\|CDD\|376911	pfam02734, Dak2, DAK2 domain. This domain is the predicted phosphatase domain of the dihydroxyacetone kinase family.	3.07102e-43
NZ_CP040506.1\|WP_006779648.1\|5387937_5389452_+\|sugar-ABC-transporter-ATP-binding-protein	gnl\|CDD\|224053	COG1129, MglA, ABC-type sugar transport system, ATPase component [Carbohydrate transport and metabolism].	0
NZ_CP040506.1\|WP_006779646.1\|5386207_5386708_+\|L-2-amino-thiazoline-4-carboxylic-acid-hydrolase	gnl\|CDD\|372958	pfam14196, ATC_hydrolase, L-2-amino-thiazoline-4-carboxylic acid hydrolase. This family of enzymes catalyzes the conversion of L-2-amino-delta2-thiazoline-4-carboxylic acid (L-ATC) to N-carbamoyl-L-cysteine. It cleaves the carbon-sulphur bond in the ring structure of L-ATC to produce N-carbamoyl-L-cysteine.	3.13206e-22
NZ_CP040506.1\|WP_006779658.1\|5399108_5399744_+\|GNAT-family-N-acetyltransferase	gnl\|CDD\|223532	COG0456, RimI, Acetyltransferases [General function prediction only].	2.7469e-08
NZ_CP040506.1\|WP_006779649.1\|5389448_5390411_+\|ABC-transporter-permease	gnl\|CDD\|224093	COG1172, AraH, Ribose/xylose/arabinose/galactoside ABC-type transport systems, permease components [Carbohydrate transport and metabolism].	9.85223e-84
NZ_CP040506.1\|WP_034858139.1\|5406766_5407438_+\|helix-turn-helix-domain-containing-protein	gnl\|CDD\|238045	cd00093, HTH_XRE, Helix-turn-helix XRE-family like proteins. Prokaryotic DNA binding proteins belonging to the xenobiotic response element family of transcriptional regulators.	1.41578e-17
NZ_CP040506.1\|WP_006779653.1\|5393159_5393789_+\|GntR-family-transcriptional-regulator	gnl\|CDD\|224715	COG1802, GntR, Transcriptional regulators [Transcription].	2.86342e-42
NZ_CP040506.1\|WP_006779656.1\|5396150_5396879_+\|YebC/PmpR-family-DNA-binding-transcriptional-regulator	gnl\|CDD\|234640	PRK00110, PRK00110, YebC/PmpR family DNA-binding transcriptional regulator.	1.05602e-144
NZ_CP040506.1\|WP_006779655.1\|5394488_5395421_+\|hypothetical-protein	gnl\|CDD\|369649	pfam08011, PDDEXK_9, PD-(D/E)XK nuclease superfamily. This family contains many hypothetical bacterial proteins. It has been identified as a member of the PD-(D/E)XK nuclease superfamily through transitive meta profile searches. DUF1703 has the predicted secondary structure pattern of the restriction endonuclease-like fold core and contains an additional beta-strand at the C-terminus.	3.2703e-09
NZ_CP040506.1\|WP_006779651.1\|5391349_5392357_+\|dihydroxyacetone-kinase-subunit-DhaK	gnl\|CDD\|376910	pfam02733, Dak1, Dak1 domain. This is the kinase domain of the dihydroxyacetone kinase family EC:2.7.1.29.	5.42153e-158
NZ_CP040506.1\|WP_006779664.1\|5404389_5405310_+\|aldo/keto-reductase	gnl\|CDD\|381318	cd19092, AKR_BsYcsN_EcYdhF-like, Bacillus subtilis YcsN, Escherichia coli YdhF and similar proteins. Bacillus subtilis YcsN and Escherichia coli YdhF are prototypes of this family. They are uncharacterized aldo/keto reductase family oxidoreductases.	3.42773e-145
NZ_CP040506.1\|WP_006779662.1\|5402224_5402422_+\|helix-turn-helix-transcriptional-regulator	gnl\|CDD\|238045	cd00093, HTH_XRE, Helix-turn-helix XRE-family like proteins. Prokaryotic DNA binding proteins belonging to the xenobiotic response element family of transcriptional regulators.	0.00010522
NZ_CP040506.1\|WP_006779647.1\|5386750_5387845_+\|sugar-ABC-transporter-substrate-binding-protein	gnl\|CDD\|380478	cd01536, PBP1_ABC_sugar_binding-like, periplasmic sugar-binding domain of active transport systems that are members of the type 1 periplasmic binding protein (PBP1) superfamily. Periplasmic sugar-binding domain of active transport systems that are members of the type 1 periplasmic binding protein (PBP1) superfamily. The members of this family function as the primary receptors for chemotaxis and transport of many sugar based solutes in bacteria and archaea. The sugar binding domain is also homologous to the ligand-binding domain of eukaryotic receptors such as glutamate receptor (GluR) and DNA-binding transcriptional repressors such as LacI and GalR. Moreover, this periplasmic binding domain, also known as Venus flytrap domain, undergoes transition from an open to a closed conformational state upon the binding of ligands such as lactose, ribose, fructose, xylose, arabinose, galactose/glucose, and other sugars. This family also includes the periplasmic binding domain of autoinducer-2 (AI-2) receptors such as LsrB and LuxP which are highly homologous to periplasmic pentose/hexose sugar-binding proteins.	1.43584e-35
NZ_CP040506.1\|WP_006779665.1\|5405425_5406448_-\|PTS-sugar-transporter-subunit-IIC	gnl\|CDD\|379113	pfam13303, PTS_EIIC_2, Phosphotransferase system, EIIC. The bacterial phosphoenolpyruvate: sugar phosphotransferase system (PTS) is a multi-protein system involved in the regulation of a variety of metabolic and transcriptional processes. The sugar-specific permease of the PTS consists of three domains (IIA, IIB and IIC). The IIC domain catalyzes the transfer of a phosphoryl group from IIB to the sugar substrate.	5.4084e-91
NZ_CP040506.1\|WP_006779659.1\|5399830_5400793_+\|Gfo/Idh/MocA-family-oxidoreductase	gnl\|CDD\|223745	COG0673, MviM, Predicted dehydrogenases and related proteins [General function prediction only].	7.11719e-52

>NZ_CP040506.1|WP_006779655.1|5394488_5395421_+|hypothetical-protein
MFREYTMLDPKKLAPFFGFADYEIEKLCENGNGVGMEQLKEWYDGYYMPEIGDVYNPRSVVEALEENLCRDYWNKTGGFSELEEYITMNFDGLGEDVTALVAGQEITVNVLGFSNDLDSFQDKDEVLTALIHLGYLTYKDGTVRIPNKEIREEFVNSIKKLSWGTVSLLLKQSRELMDALLLRDVALVGQLLESVHDDMQEFKEYNNEHTLKCVIHLAFYAASDDYTLQFESAAGKGYADCCMIPKKPGLPGIILELKYNGNLGKAIEQIKEKNYMKIFEQQVKSIYLVTINYDKKSKKHKCCIEVVDNK
>NZ_CP040506.1|WP_138670010.1|5394083_5394461_+|hypothetical-protein
MKIKNTVCYYKHLNTHNVICINFNDYFENLSVTEGIAKISERLIHDLKQAFPNILGGEDDLILCLDMITQVSGEKFIFLIDEWDCVFRFHKGEGQEQQQFLSFMKLLLKDKSYVELAYITGILPI
>NZ_CP040506.1|WP_006779653.1|5393159_5393789_+|GntR-family-transcriptional-regulator
MQKVALKDQVYKSILKEILDGKFSMDSIINEKVLSEQFEVSKTPVREALVRLCSEGILENLPRYGYRLIPVTQNEIQEIIEYRKVMEIEALRLSFDYIGPADIQKLKQLDESAQEAVISRDVHLAWERNENFHWELGDLCPNRYFRSSIKSALTVGNRYANQYFSSIWREDKPLDRSHTKIIEALEEKDLAKAQEILTFDIELMKAILL
>NZ_CP040506.1|WP_006779652.1|5392378_5392999_+|dihydroxyacetone-kinase-subunit-L
MEIQAVKRAVSAVYEKMAEQKDYLIQLDQQNGDGDLGLSMCGGFGALCEALDATEETDFGKVFLMASKTFNEAAPSSLGTILSFGMMGMAKKLKGKTEVSQEEMAEAMQAGVDNIMEKAGSKVGEKTILDALVPAIEELRRCGGEMAAGDVWAAAAAAAGQGSESTRQMKSVHGRAAYYAEKSIGILDGGSVVGKLIFEGIAESVR
>NZ_CP040506.1|WP_006779651.1|5391349_5392357_+|dihydroxyacetone-kinase-subunit-DhaK
MKKMINAPADFVQETVEGIIAAYGDRLTLLNGDFRMVMSNRPGREGKVGIVTGGGSGHLPLFLGYVGDGMVDGCAVGNVFASPSAGKMSELIKACDFGSGVLCLYGNYGGDNMNFKMACDEAEFEDIETRIVTAADDVASAPAELAQKRRGVAGLIYAYKIAGAAADERRSLDEVADAAKKALGNIRSMGVALSPCIVPEVGEPTFSIPDDEIEIGMGIHGEKGIEVCKMLTADETAAVILKKIVADMQLEAGDEVSVMINGLGATPLEEQMILYRAVHRTLDEMGVSVFMPHIGEFATSMEMAGLSVTIFKLDEELKRLLRAPASTPFYTNANK
>NZ_CP040506.1|WP_006779650.1|5390465_5391302_+|alpha/beta-hydrolase
MEYAEHYCYVEPDIRLHYIDEGSGRTIVFVTGFSGSAQGFEHQIEYFKQSFRVIAVDPRNHGKSSWSPRGNTYAQQGRDLGVLMETLGLEHVILAGWSFGAYAVLNYLEQFGTKRVDAFVTIDNPVCAISEDEREFRAGNLDMLRDFHFRYFQSEEGFRQFVVENFIDGIFFLNPPQDEEGRNRVLNTCLRLPLEVGDQLIVDGHLSDKRDVMKTVDESIPCLFYVADYRKEAGLRCIPRDYPNSEVVTLGNHMMFYEFPEVFNHIMEDFLQRHHLVE
>NZ_CP040506.1|WP_006779649.1|5389448_5390411_+|ABC-transporter-permease
MSGKIDGKKIFKQYGITLVLLALCILFTILNPVFFTLRNIMNVMRQMSMIGIASVGGMFVIIQGGIDLSEGAVVSFVNVVCAWLMMSAGMSPELAILISLIVSAAIGYLNGVLVTMAKMPPLIVTLAVQGGLYGISYIITNSHSIAGFPDSFRFIGQGYIGFLPVPVVLMVLVLAIGWFVLNKTYFGRYIYAIGGNDDVARLSGIRVNRIRRLVYMLGGLFAGVSGVIFLSRLMSGQANTGAGFEMDVLTALVLGGVSINGGSGKIFNAVMGVAIIGVLNNGLVLVNVNQHVQEVIKGVVLIAAVAFDCLSKSKSSGNEA
>NZ_CP040506.1|WP_006779648.1|5387937_5389452_+|sugar-ABC-transporter-ATP-binding-protein
MENNIALELKNISKQYPGVLALDSMSITFRKGEIHALLGENGAGKSTLIKVCTGAIRPSSGTIEIGGQQFSHMTPQLSEQNGVAVVYQELNLVEELSVAENIYLGQKAGGRHLFNGAAVAKKAQELLDRLEMNLPATAKIKELSPGYQQLVEIAKALSLDARILILDEPSAALTDSEVQKLFKTILKMQEMGTTVIYISHRLDEIFQIADRVTVLRDGCKIQTLDVKDTDKDRLISLMVGREMTEVYPKYEGREGEPEDVILDISHVSGNGLKDISFQVRKGEILGLGGLVGAGRTELAQILFGVVKKDAGVIRIHGQEVEFHSPTEAIAHGIALVPEDRKQQGLILNMSIEKNISLASLKRMSKGLVINNRTEKITAQDYAKALKLKAASLEYDADTLSGGNQQKIVLAKWMATEPDIIILDEPTRGVDVGAKYEIYLLMHEMIRAGKTLIMISSEMEELINMSDRIVVLSEGRQAGELKKEEFNQETILKYASGADAKEVCS
>NZ_CP040506.1|WP_006779647.1|5386750_5387845_+|sugar-ABC-transporter-substrate-binding-protein
MKKQFLAAGLSVVLGSMMVLAGCSNGDGGTTTAASATAQEEKKTEMTTTAGAAGDTSAAANGAVTKDNAKWKVGVTITDLTVPVWDDYAQAIKKYGEPEGMYVNIVSPEGNAAEQISQMENFVTDGYDVIVVSAADNESMGQEAKKVTEEGVIVFSQGYEFDNYSAAMLEEKQVFGHHTAEMASRWINEKYPDGKCKVIVAGNQTIPLMMERTEGIYNGLKEFAPNAEVVATVYGSNEEEFLPMMENAFTANPDANMVISYCAGGALAAREAAKGMGLASDDFGIFCTDCDDGVADAIYNDDLIRGGLSMGGGDYMAKAVVETLVKMLNGEEYDKVINFPEIEVNKDNVLEQADALGYKVQSAK
>NZ_CP040506.1|WP_006779646.1|5386207_5386708_+|L-2-amino-thiazoline-4-carboxylic-acid-hydrolase
MAIKNNENPVMETVAVNRSQIEHRATWMGLIYDEMKKEGLDAEGIIRRAIKRTGCIHGEGFRKQCADPADGSQFCQVFLGTEDNVGPQTFGMDHICSDRDNVSVEFHYCALVSAWKKLGFDDETCALLCDIAMDGDRGIAEAMGMTLDLTDTIAKGCETCKLHFYK
>NZ_CP040506.1|WP_006779656.1|5396150_5396879_+|YebC/PmpR-family-DNA-binding-transcriptional-regulator
MSGHSKFANIKHKKERNDAAKGKVFTVIGREIAVAVKEGGADPANNSKLRDVIAKAKANNMPNDTIDRGIKKAAGDANSVNYEVLTYEGYGPNGVAIIVDTLTDNKNRTAANVRSAFTKGSGNVGTPGSVSYMFDKKGQIIIDKEECEMDPDELMMAALDAGAEDFAEEEDSFEILTAPDDFSAVREALEAAGIPMMEADVTMIPQTWVELDDEDSIKKMNKILDLLDEDDDVQAVYHNWDE
>NZ_CP040506.1|WP_006779657.1|5397109_5399104_+|M28-family-peptidase
MDSKIEDWNEDVEYAFRLAKRMEEFRSNPALGYRTAGSKAEFETGEMLLAEMRQLGFSNVRKEQIRVDAWEFERAVLRCRIEDTGRYREFQLGAYQTNFHTAGFQEYSIIYAGKGTARDYEGLDVSGKLVLVEINQREEWWINFPVYQAHVKGAAAVIAVQERGFGEVDSTALNAQDIAGPAGAPAFSISQADAAALRELMGDGREMKALFDAETSVRTDCRSYNIVGEIPGEEEEMILLTAHYDSYFSGFQDDNAAVAMMFGIGKHLLERGYRPRKTLVFCAVSAEEWGVSNSKYDWSVGAWRQVFEVHPEWQGKVMADLNFELPAHAHDRKDGIRCVYEYEDFLRHFLGTIKVDETAYPGGIEVHSPIQTMSDDFSMAIAGIPSMVNDFTSGSFMETHYHSQFDNEEFYEEAVYRFHHYLYGELVQAFDRTVLPPLDFGRLFEAMVESIDLEFSKEAYESGIRLKQLALQAVEEGRRVYRWITQINHMAGMTASGGYERERRILMQVFRKAQDSFVRLNWHDEVLFPQELVRKNLSHIRRAECCLDGGDIRGALEEIYEIDNNRYAFLFDREVFDYFTDYVFGRPKEELLWGGGRIVHHENLYGLVSSLRKKYETHSTDVTQELEVLKRVEANQMEYYLADIDYMIRETELIINNLKKIEGI
>NZ_CP040506.1|WP_006779658.1|5399108_5399744_+|GNAT-family-N-acetyltransferase
MESQKLYRVERNDMGRLEELLAECFMRDPLYCRLIPDEETRVRLMPELMHCDLEEMFATCEIFADSPDIHGVLVVSDESEPYNIFQYYLTEAYASLKTEECLIREDPSLKTFWNFFLGRDYLNSRWTDQLHQEERLHIIYLAVEPAMQHHGISTLLMDEAIAYAREHQLMISLETHNEKNVAMYQHYGFKIYGVVEKHFDLKQYCLVREVQ
>NZ_CP040506.1|WP_006779659.1|5399830_5400793_+|Gfo/Idh/MocA-family-oxidoreductase
MKIGVVGNGMIVKRFLEDLKQVEGASAEAICVRSQSREKGEQLAAAYEIGKVYTDYPECLRDGSLDAVYIGIINSEHYEYVKLALEAGKHVICEKPFTVEAWEARELAKLAREKGLFLWEAFKIAYSPVFQSVKEHLTEIGAVKLVQCNYSRVSSRYADYLEGRVLPAFDPELSGGCMYDINLYNLHFTVGLFGRPNALHYYANKGYNGIDTSGVVVMEYDGFQAVLTGSKDSSSPCGCVIQGEQGYIRTEGPASAASSAEINLGNGPVPIAQDEENGTLAGETRAFVAQYENGDYESCYQMLEHSVLVMELLEAAVKDR
>NZ_CP040506.1|WP_006779662.1|5402224_5402422_+|helix-turn-helix-transcriptional-regulator
MATRIPCTPFGKRMKIAMVEQDIPQHELAKRLGLASSTVSDVIYGRNCCERTKERIAETLGIRVN
>NZ_CP040506.1|WP_138670012.1|5402536_5404123_+|transposase
MRLNKNTNDNYTVRQLKLPLEIEKLIDISDPVYTFCEVMDHIDLSKYFVAKGYKTGRPRCDEHKLLKVILFAFMEHGISSLRDIEKLCRNDIRYLYLLDGMKAPSFATIGSFIRKELTDSIEQIFLDVNTYIFQKDHVDLEHVYLDGTKIEANANRYTWVWKKSCTRNRGKVFEKISMLLDAMNQEVLGYLNLKLEKREEYAIGYVSELLELYRKGTGLDESMFVSGCGHRKSIYQKQYQELQGYLERLKTYAHHIEICGEERNSYSKTDHSATFMRLKRDYMGNDQLLPAYNLQTAVCDEYIAVVEVKPYASDMECFVPLMEKFHKTYGRYPKYPVADAGYGSYNNYLYCEEHGMEKYMKFTMFQKETKDKKYHENPYRAVNFQRDESGNLLCPGGRKFRFKCRRPVYKNQYGRTEELYECESCEGCEYKSECSPKASGNRTIRMNEELTAIHQEVLSNLESIHGALLRMNRSIQAEGTFGVLKWDRSYKRLFRRGEKNVILELTLISCGFNIYKYHNKKQRKEAAA
>NZ_CP040506.1|WP_006779664.1|5404389_5405310_+|aldo/keto-reductase
MKHIKLGRSGLTVPAIAVGCMRINEMGSAQVAEWIDGALEMGANFFDHADIYGRGACEELFGQAMAEAGVKREDVILQSKCGIIPGKMYDCSKEHILESVEKSLKRLGTEYLDVLLLHRPDALIEPEEVAEAFDELERSGKVRHFGVSNQNSMQMELLRRYVKQELAADQLQLSVTNSNMIRSGLEVNMQTEGAVNRDGSVLDYCRLHDITIQVWSPFQYGFFEGVFLGSLEYPELNQVIDEIAKGYGVSATAIATAWIMRHPAEMQMIAGTTKLGRLRDICESSEIVLSREEWYRIYLAAGHMLP
>NZ_CP040506.1|WP_006779665.1|5405425_5406448_-|PTS-sugar-transporter-subunit-IIC
MNQTGVKAFLARKNVSITVKTYLIDALGAMAFGLFASLLIGTIFATLGEKTNIALFVTIADYAKGATGAALGVSIAYALKAPQLVLFSAATVGIAGNALGGPVGALVATIVGTELGKIVSKETRVDILVTPGVTIISGVLVAQFAGPGVSAFMTAFGNLVKNATEMQPFFMGILVSALIGIALTLPISSAAICIMLSLDGLAGGAATAGCCAQMIGFAVLSFRENGIGGLLAQGLGTSMLQMGNIVKNPRIWIPPTLASMITGPIATMVFKLQNIPAGSGMGTCGLVGPIGVYTAMGGGTSMWIGILLVCFVLPAVLTYGFGIVLRRMGWIKDGDLKLDL
>NZ_CP040506.1|WP_034858139.1|5406766_5407438_+|helix-turn-helix-domain-containing-protein
MMFSEKLQIIRKNRGLTQEELAEKLSVSRQAVAKWEAGHTYPDITNLIGISNFFNVTVDYLVKEQECSLNITDAQDKDIERLILFRLEANVNTYAAYMNETSPTRLNSHDFTYTNAPYLYHDTYVGGEKFAGEEVIWHEGNVQYAMNYCGQVLGQQFSGDFLKEALRKADMKMPYRGPEYYQSGEYTYKCNVVGDFTWFQGYEEIYCNTEKVYECYFHGGTTN
>NZ_CP040506.1|WP_006779667.1|5407559_5408966_-|glucuronate-isomerase
MKQFMDKDFLLSTESARMLYHDFAEKMPVLDYHCHINPQEIAEDRKFDNITQVWLGGDHYKWRQMRSNGVEEKYITGDASDREKFQKWAETLPKLIGNPLYHWSHLELQKYFGYTGYLNGDTAEEVWNLCNAKLQEDSMSVRNIIRQSNVTLICTTDDPVDSLEWHKKIAADTTFDVQVLPAWRPDKAMNVEKPTFAAYMAQLSEVSGVKVTDFASLKEALKNRMAYFAENGCCVSDHALEYVMYVPATDAEVDAVMAKGLAGQPVSKEEELQYKTAFMLFVAREYNRMGWIMQLHYGCKRDNNAFMFEKLGADTGFDCINNYAPSAQMADFLNALSAGNEIPKTIIYSLNPNDNASIGTIIGCFQDTAAAGKIQQGSAWWFNDHKVGMTEQMTSLANLGCLGNFIGMLTDSRSFLSYTRHEYFRRIMCELIGGWVENGEYPADMKALKEIVEGISYNNAVKYFGFNL

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Mismatch	Identity

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity
NZ_CP040506_6	6.2\|4526038\|30\|NZ_CP040506\|CRT	4526038-4526067	30	NC_029005	Streptomyces phage phiSAJS1, complete genome	25000-25029	6	0.8
NZ_CP040506_2	2.27\|3208612\|34\|NZ_CP040506\|CRISPRCasFinder,CRT	3208612-3208645	34	NZ_CP014068	Enterococcus gallinarum strain FDAARGOS_163 plasmid unnamed, complete sequence	15850-15883	7	0.794
NZ_CP040506_2	2.57\|3208617\|34\|NZ_CP040506\|PILER-CR	3208617-3208650	34	NZ_CP014068	Enterococcus gallinarum strain FDAARGOS_163 plasmid unnamed, complete sequence	15850-15883	7	0.794
NZ_CP040506_6	6.2\|4526038\|30\|NZ_CP040506\|CRT	4526038-4526067	30	NZ_CP019297	Vibrio campbellii strain LMB29 plasmid pLMB99, complete sequence	52948-52977	7	0.767
NZ_CP040506_6	6.2\|4526038\|30\|NZ_CP040506\|CRT	4526038-4526067	30	NZ_CP020081	Vibrio campbellii strain 20130629003S01 plasmid pVCGX4, complete sequence	18078-18107	7	0.767
NZ_CP040506_6	6.2\|4526038\|30\|NZ_CP040506\|CRT	4526038-4526067	30	MW084976	Bacillus phage Kirov, complete genome	50075-50104	7	0.767
NZ_CP040506_6	6.2\|4526038\|30\|NZ_CP040506\|CRT	4526038-4526067	30	NZ_CP022991	Paraburkholderia aromaticivorans strain BN5 plasmid pBN1, complete sequence	283095-283124	8	0.733
NZ_CP040506_6	6.2\|4526038\|30\|NZ_CP040506\|CRT	4526038-4526067	30	MN693358	Marine virus AFVG_25M395, complete genome	15246-15275	8	0.733
NZ_CP040506_7	7.2\|5395727\|35\|NZ_CP040506\|CRISPRCasFinder	5395727-5395761	35	CP046512	Bacillus cereus strain JHU plasmid p1, complete sequence	48925-48959	8	0.771
NZ_CP040506_2	2.7\|3207307\|34\|NZ_CP040506\|CRISPRCasFinder,CRT	3207307-3207340	34	NC_013940	Deferribacter desulfuricans SSM1 megaplasmid pDF308, complete sequence	256871-256904	9	0.735
NZ_CP040506_2	2.37\|3207309\|34\|NZ_CP040506\|PILER-CR	3207309-3207342	34	NC_013940	Deferribacter desulfuricans SSM1 megaplasmid pDF308, complete sequence	256871-256904	9	0.735
NZ_CP040506_3	3.17\|3219575\|34\|NZ_CP040506\|CRISPRCasFinder	3219575-3219608	34	MN033296	Leviviridae sp. isolate H4_Rhizo_Litter_20_scaffold_389 RNA-dependent RNA polymerase (H4RhizoLitter20389_000001), hypothetical protein (H4RhizoLitter20389_000002), and hypothetical protein (H4RhizoLitter20389_000003) genes, complete cds	3462-3495	9	0.735
NZ_CP040506_2	2.7\|3207307\|34\|NZ_CP040506\|CRISPRCasFinder,CRT	3207307-3207340	34	NZ_CP014607	Endosymbiont 'TC1' of Trimyema compressum strain not applicalbe isolate TC1 plasmid pTC1, complete sequence	19518-19551	10	0.706
NZ_CP040506_2	2.30\|3208807\|34\|NZ_CP040506\|CRISPRCasFinder,CRT	3208807-3208840	34	MN284895	Mycobacterium phage Marshawn, complete genome	35327-35360	10	0.706
NZ_CP040506_2	2.37\|3207309\|34\|NZ_CP040506\|PILER-CR	3207309-3207342	34	NZ_CP014607	Endosymbiont 'TC1' of Trimyema compressum strain not applicalbe isolate TC1 plasmid pTC1, complete sequence	19518-19551	10	0.706
NZ_CP040506_2	2.60\|3208812\|34\|NZ_CP040506\|PILER-CR	3208812-3208845	34	MN284895	Mycobacterium phage Marshawn, complete genome	35327-35360	10	0.706
NZ_CP040506_2	2.7\|3207307\|34\|NZ_CP040506\|CRISPRCasFinder,CRT	3207307-3207340	34	NZ_LN906635	Lactobacillus reuteri plasmid p53608_1, complete genome, strain ATCC 53608	131546-131579	11	0.676
NZ_CP040506_2	2.37\|3207309\|34\|NZ_CP040506\|PILER-CR	3207309-3207342	34	NZ_LN906635	Lactobacillus reuteri plasmid p53608_1, complete genome, strain ATCC 53608	131546-131579	11	0.676

1. spacer 6.2|4526038|30|NZ_CP040506|CRT matches to NC_029005 (Streptomyces phage phiSAJS1, complete genome) position: , mismatch: 6, identity: 0.8

gcagaaacaacagccagaacagcggccaga	CRISPR spacer
gccggagttacagccagaacatcggccaga	Protospacer
** *.*.. ************ ********

2. spacer 2.27|3208612|34|NZ_CP040506|CRISPRCasFinder,CRT matches to NZ_CP014068 (Enterococcus gallinarum strain FDAARGOS_163 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.794

tgtataccggtgtcaatcaggaaggacagaccta	CRISPR spacer
tgtatgccggtgtcaatcaggaagaacgaacaac	Protospacer
*****.******************.**..**

3. spacer 2.57|3208617|34|NZ_CP040506|PILER-CR matches to NZ_CP014068 (Enterococcus gallinarum strain FDAARGOS_163 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.794

tgtataccggtgtcaatcaggaaggacagaccta	CRISPR spacer
tgtatgccggtgtcaatcaggaagaacgaacaac	Protospacer
*****.******************.**..**

4. spacer 6.2|4526038|30|NZ_CP040506|CRT matches to NZ_CP019297 (Vibrio campbellii strain LMB29 plasmid pLMB99, complete sequence) position: , mismatch: 7, identity: 0.767

gcagaaacaacagccagaacagcggccaga	CRISPR spacer
gcagaaacagcagctagaacagcgatagca	Protospacer
*********.****.*********.. . *

5. spacer 6.2|4526038|30|NZ_CP040506|CRT matches to NZ_CP020081 (Vibrio campbellii strain 20130629003S01 plasmid pVCGX4, complete sequence) position: , mismatch: 7, identity: 0.767

gcagaaacaacagccagaacagcggccaga	CRISPR spacer
gcagaaacagcagctagaacagcgatagca	Protospacer
*********.****.*********.. . *

6. spacer 6.2|4526038|30|NZ_CP040506|CRT matches to MW084976 (Bacillus phage Kirov, complete genome) position: , mismatch: 7, identity: 0.767

gcagaaacaacagccagaacagcggccaga	CRISPR spacer
gcagaaacaacagacggaacagcttataca	Protospacer
************* *.*******   .* *

7. spacer 6.2|4526038|30|NZ_CP040506|CRT matches to NZ_CP022991 (Paraburkholderia aromaticivorans strain BN5 plasmid pBN1, complete sequence) position: , mismatch: 8, identity: 0.733

gcagaaacaacagccagaacagcggccaga	CRISPR spacer
tcacgaacatcagccagaacagcggcgtct	Protospacer
 ** .**** ****************

8. spacer 6.2|4526038|30|NZ_CP040506|CRT matches to MN693358 (Marine virus AFVG_25M395, complete genome) position: , mismatch: 8, identity: 0.733

gcagaaacaacagccagaacagcggccaga	CRISPR spacer
aatgatacaacagccagaacaacggcgggt	Protospacer
.  ** ***************.**** .*

9. spacer 7.2|5395727|35|NZ_CP040506|CRISPRCasFinder matches to CP046512 (Bacillus cereus strain JHU plasmid p1, complete sequence) position: , mismatch: 8, identity: 0.771

tcagtttttaataattctttca-----ttccgtcctgaaa	CRISPR spacer
tcaattttcaataattctttcattcatttccctcc-----	Protospacer
***.****.*************     **** ***

10. spacer 2.7|3207307|34|NZ_CP040506|CRISPRCasFinder,CRT matches to NC_013940 (Deferribacter desulfuricans SSM1 megaplasmid pDF308, complete sequence) position: , mismatch: 9, identity: 0.735

aggatatgaaatacaaaaataaagaggggtatta	CRISPR spacer
tagaaatgaaatacaaaaagaaagaggcaccttg	Protospacer
 .** ************** ******* .. **.

11. spacer 2.37|3207309|34|NZ_CP040506|PILER-CR matches to NC_013940 (Deferribacter desulfuricans SSM1 megaplasmid pDF308, complete sequence) position: , mismatch: 9, identity: 0.735

aggatatgaaatacaaaaataaagaggggtatta	CRISPR spacer
tagaaatgaaatacaaaaagaaagaggcaccttg	Protospacer
 .** ************** ******* .. **.

12. spacer 3.17|3219575|34|NZ_CP040506|CRISPRCasFinder matches to MN033296 (Leviviridae sp. isolate H4_Rhizo_Litter_20_scaffold_389 RNA-dependent RNA polymerase (H4RhizoLitter20389_000001), hypothetical protein (H4RhizoLitter20389_000002), and hypothetical protein (H4RhizoLitter20389_000003) genes, complete cds) position: , mismatch: 9, identity: 0.735

ggattgattgttctggtggtgcttttagcatttc	CRISPR spacer
gcccttatcgttctggtggtgctttcagcacgac	Protospacer
*  .* **.****************.****.  *

13. spacer 2.7|3207307|34|NZ_CP040506|CRISPRCasFinder,CRT matches to NZ_CP014607 (Endosymbiont 'TC1' of Trimyema compressum strain not applicalbe isolate TC1 plasmid pTC1, complete sequence) position: , mismatch: 10, identity: 0.706

aggatatgaaatacaaaaataaagaggggtatta	CRISPR spacer
ataatatgaaaaacaaaaataaacaggtagctag	Protospacer
* .******** *********** *** .  * .

14. spacer 2.30|3208807|34|NZ_CP040506|CRISPRCasFinder,CRT matches to MN284895 (Mycobacterium phage Marshawn, complete genome) position: , mismatch: 10, identity: 0.706

gatattatggcgacaaacagggagctgccggaca	CRISPR spacer
gcctggatggcgacaaacagggtgatgccgcgct	Protospacer
* .   **************** * ***** .*

15. spacer 2.37|3207309|34|NZ_CP040506|PILER-CR matches to NZ_CP014607 (Endosymbiont 'TC1' of Trimyema compressum strain not applicalbe isolate TC1 plasmid pTC1, complete sequence) position: , mismatch: 10, identity: 0.706

aggatatgaaatacaaaaataaagaggggtatta	CRISPR spacer
ataatatgaaaaacaaaaataaacaggtagctag	Protospacer
* .******** *********** *** .  * .

16. spacer 2.60|3208812|34|NZ_CP040506|PILER-CR matches to MN284895 (Mycobacterium phage Marshawn, complete genome) position: , mismatch: 10, identity: 0.706

gatattatggcgacaaacagggagctgccggaca	CRISPR spacer
gcctggatggcgacaaacagggtgatgccgcgct	Protospacer
* .   **************** * ***** .*

17. spacer 2.7|3207307|34|NZ_CP040506|CRISPRCasFinder,CRT matches to NZ_LN906635 (Lactobacillus reuteri plasmid p53608_1, complete genome, strain ATCC 53608) position: , mismatch: 11, identity: 0.676

aggatatgaaatacaaaaataaagaggggtatta	CRISPR spacer
ttctttccttatataaaaataaaaaggggtatta	Protospacer
    * .   ***.*********.**********

18. spacer 2.37|3207309|34|NZ_CP040506|PILER-CR matches to NZ_LN906635 (Lactobacillus reuteri plasmid p53608_1, complete genome, strain ATCC 53608) position: , mismatch: 11, identity: 0.676

aggatatgaaatacaaaaataaagaggggtatta	CRISPR spacer
ttctttccttatataaaaataaaaaggggtatta	Protospacer
    * .   ***.*********.**********

Prophage detection

Region

Region Position

Protein_number

Hit_taxonomy

Key_proteins

Att_site

Prophage annotation

DBSCAN-SWA_1

1137171 : 1161820

Arthrobacter_phage(27.27%)

portal,terminase,tail,head,protease

The bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_100932830.1\|1137171_1138242_-	hypothetical protein	A0A218M5L3	Arthrobacter_phage	2.0e-36	30.3
WP_006780986.1\|1138244_1139159_-\|tail	phage tail family protein	A0A221J6H3	Arthrobacter_phage	2.5e-16	26.4
WP_006780987.1\|1139155_1145668_-	tape measure protein	A0A2K9V3D0	Faecalibacterium_phage	1.1e-169	35.1
WP_006780988.1\|1145664_1146042_-	HK97 gp10 family phage protein	A0A221J6H1	Arthrobacter_phage	1.1e-37	61.5
WP_006780989.1\|1146054_1147059_-	N-acetylmuramoyl-L-alanine amidase	H7BV89	unidentified_phage	3.4e-99	67.9
WP_006780990.1\|1147064_1147607_-	hypothetical protein	A0A223LIU1	Streptomyces_phage	3.1e-46	52.2
WP_006780991.1\|1147621_1148023_-	hypothetical protein	D4P7H5	Rhodococcus_phage	3.0e-06	28.0
WP_034859381.1\|1148083_1148299_-	hypothetical protein	NA	NA	NA	NA
WP_006780993.1\|1148469_1149177_-	hypothetical protein	A0A223LJF7	Streptomyces_phage	6.8e-78	63.5
WP_006780994.1\|1149195_1149522_-	hypothetical protein	A0A222ZIL3	Arthrobacter_phage	1.3e-18	43.4
WP_006780995.1\|1149514_1149829_-	hypothetical protein	A0A2D1GNN3	Streptomyces_phage	2.4e-27	53.8
WP_006780996.1\|1149844_1150054_-	hypothetical protein	NA	NA	NA	NA
WP_006780997.1\|1150230_1152096_-\|head,protease	caudovirus prohead protease	A0A223LHN8	Streptomyces_phage	2.3e-104	42.8
WP_006780998.1\|1152139_1152970_-	hypothetical protein	A0A0U4IJV5	Arthrobacter_phage	3.2e-10	55.4
WP_006780999.1\|1152969_1154310_-\|portal	phage portal protein	A0A2K9V3B6	Faecalibacterium_phage	2.2e-141	62.4
WP_006781000.1\|1154327_1156073_-\|terminase	terminase	A0A2P1JY91	Gordonia_phage	3.9e-276	76.1
WP_006781001.1\|1156084_1156417_-	hypothetical protein	A0A2D1GNW4	Streptomyces_phage	1.5e-06	31.1
WP_006781002.1\|1156413_1156944_-	hypothetical protein	A0A2K9V397	Faecalibacterium_phage	1.2e-29	55.4
WP_034859382.1\|1156966_1157380_-	hypothetical protein	D4P7C0	Rhodococcus_phage	1.8e-38	57.5
WP_006781004.1\|1157372_1157711_-	hypothetical protein	D4P7M8	Rhodococcus_phage	4.2e-25	61.4
WP_006781005.1\|1157988_1158240_-	hypothetical protein	A0A2D1GP15	Streptomyces_phage	7.6e-16	50.6
WP_006781006.1\|1158249_1160997_-	hypothetical protein	A0A2K9V3F0	Faecalibacterium_phage	2.3e-222	49.9
WP_006781007.1\|1161000_1161558_-	DUF2800 domain-containing protein	A0A2P1JYD4	Gordonia_phage	1.6e-61	61.9
WP_006781008.1\|1161529_1161820_-	hypothetical protein	A0A222Z7R3	Arthrobacter_phage	1.1e-21	52.2

DBSCAN-SWA_2

1166677 : 1185253

Faecalibacterium_phage(40.0%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_006781020.1\|1166677_1167745_-	hypothetical protein	A0A2H4JDQ6	uncultured_Caudovirales_phage	1.2e-30	63.5
WP_006781021.1\|1167848_1168613_-	hypothetical protein	NA	NA	NA	NA
WP_006781022.1\|1168618_1169173_-	LemA family protein	A0A0C5K8T5	Enterococcus_phage	5.6e-27	37.5
WP_006781023.1\|1169159_1169351_-	hypothetical protein	NA	NA	NA	NA
WP_006781024.1\|1169347_1169548_-	hypothetical protein	NA	NA	NA	NA
WP_006781025.1\|1169531_1170059_-	hypothetical protein	NA	NA	NA	NA
WP_006781027.1\|1170227_1171466_-	DEAD/DEAH box helicase family protein	A0A2K9V3D1	Faecalibacterium_phage	2.3e-161	65.8
WP_006781029.1\|1171642_1172530_-	SAM-dependent DNA methyltransferase	A0A2K9V411	Faecalibacterium_phage	1.0e-46	40.9
WP_006781030.1\|1172622_1173108_-	hypothetical protein	D4P7U6	Rhodococcus_phage	1.1e-37	49.7
WP_006781031.1\|1173127_1177228_-	hypothetical protein	A0A2K9V387	Faecalibacterium_phage	0.0e+00	59.0
WP_006781032.1\|1177236_1177470_-	hypothetical protein	NA	NA	NA	NA
WP_006781033.1\|1177471_1177684_-	hypothetical protein	NA	NA	NA	NA
WP_006781034.1\|1177701_1178250_-	hypothetical protein	A0A2K9V356	Faecalibacterium_phage	3.2e-43	47.0
WP_006781035.1\|1178246_1178864_-	hypothetical protein	A0A0U4JYC9	Arthrobacter_phage	1.1e-12	29.3
WP_006781036.1\|1178853_1179018_-	hypothetical protein	A0A2K9V391	Faecalibacterium_phage	7.4e-12	62.3
WP_006781038.1\|1179137_1179707_-	cell wall hydrolase	A0A0K2FM09	Brevibacillus_phage	1.1e-06	29.4
WP_100932823.1\|1179773_1180739_-	hypothetical protein	D4P7T7	Rhodococcus_phage	7.7e-56	40.8
WP_006781040.1\|1180741_1181002_-	DUF3310 domain-containing protein	A0A1X9I635	Streptococcus_phage	1.3e-07	39.1
WP_006781041.1\|1181016_1181619_-	hypothetical protein	D4P7H8	Rhodococcus_phage	1.7e-24	32.7
WP_007868844.1\|1181618_1181825_-	hypothetical protein	NA	NA	NA	NA
WP_006781043.1\|1181908_1182175_-	hypothetical protein	NA	NA	NA	NA
WP_006781044.1\|1182245_1183019_-	hypothetical protein	A0A222ZI28	Arthrobacter_phage	7.8e-43	37.8
WP_006781045.1\|1183018_1183897_-	hypothetical protein	NA	NA	NA	NA
WP_006781046.1\|1183929_1184220_-	hypothetical protein	NA	NA	NA	NA
WP_006781048.1\|1184473_1185253_-	hypothetical protein	A0A2K9V393	Faecalibacterium_phage	1.8e-31	35.1

DBSCAN-SWA_3

1548181 : 1554082

Enterobacteria_phage(42.86%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_006781439.1\|1548181_1548736_-	dTDP-4-dehydrorhamnose 3,5-epimerase	I7HJC4	Enterobacteria_phage	4.0e-49	54.3
WP_006781438.1\|1548771_1549617_-	dTDP-4-dehydrorhamnose reductase	A0A291LA50	Escherichia_phage	4.2e-34	35.5
WP_006781437.1\|1549616_1550639_-	dTDP-glucose 4,6-dehydratase	I7HTA3	Enterobacteria_phage	2.1e-80	45.6
WP_006781436.1\|1550693_1551575_-	glucose-1-phosphate thymidylyltransferase RfbA	I7I009	Enterobacteria_phage	2.6e-103	64.7
WP_006781435.1\|1551897_1552101_+	cold-shock protein	Q9AZD3	Lactococcus_phage	6.6e-18	64.2
WP_034859739.1\|1552197_1553406_-	methyltransferase domain-containing protein	NA	NA	NA	NA
WP_006781433.1\|1553436_1553862_-	antitoxin HicB	I3NLB2	Bifidobacterium_phage	9.2e-30	52.3
WP_006781432.1\|1553899_1554082_-	type II toxin-antitoxin system HicA family toxin	I3NLB3	Bifidobacterium_phage	6.3e-12	56.7

DBSCAN-SWA_4

1982462 : 1993200

Bacillus_phage(66.67%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_138669611.1\|1982462_1984256_-	ATP-binding cassette domain-containing protein	W8CYL7	Bacillus_phage	8.4e-32	24.5
WP_006781779.1\|1984456_1986163_-	FAD-dependent oxidoreductase	G3MA85	Bacillus_virus	3.0e-55	40.6
WP_138669613.1\|1986234_1986798_-	peroxiredoxin	NA	NA	NA	NA
WP_006781782.1\|1987106_1988885_-	ABC transporter ATP-binding protein	W8CYL7	Bacillus_phage	1.3e-48	27.7
WP_006781783.1\|1988875_1990642_-	ABC transporter ATP-binding protein	W8CYL7	Bacillus_phage	6.1e-43	26.6
WP_006781785.1\|1991123_1991822_-	response regulator transcription factor	W8CYM9	Bacillus_phage	6.6e-25	28.8
WP_138670155.1\|1991814_1993200_-	sensor histidine kinase	A0A1V0SKH0	Klosneuvirus	4.5e-09	24.6

DBSCAN-SWA_5

3861366 : 3868349

Acinetobacter_phage(50.0%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_006778310.1\|3861366_3862155_-	indole-3-glycerol phosphate synthase TrpC	A0A0P0IR83	Acinetobacter_phage	8.2e-40	39.2
WP_006778311.1\|3862182_3863196_-	anthranilate phosphoribosyltransferase	A0A0N7IRD9	Acinetobacter_phage	1.7e-69	41.5
WP_006778312.1\|3863192_3863765_-	aminodeoxychorismate/anthranilate synthase component II	A0A0P0IKJ1	Acinetobacter_phage	1.9e-46	46.4
WP_080568843.1\|3863764_3865237_-	anthranilate synthase component I family protein	S4VNU7	Pandoravirus	2.0e-31	34.3
WP_006778314.1\|3865736_3866285_+	stage V sporulation protein T	A0A2I7SC16	Paenibacillus_phage	6.1e-10	68.6
WP_006778315.1\|3866325_3867642_-	sensor histidine kinase	NA	NA	NA	NA
WP_006778316.1\|3867638_3868349_-	response regulator transcription factor	A0A2R2ZGH8	Clostridioides_phage	9.1e-22	31.3

DBSCAN-SWA_6

4329922 : 4334207

Synechococcus_phage(50.0%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_006778723.1\|4329922_4331110_-	glycosyltransferase family 4 protein	A0A2P0VNG4	Tetraselmis_virus	4.6e-10	28.7
WP_006778724.1\|4331121_4331877_-	NTP transferase domain-containing protein	A0A1D8KNV9	Synechococcus_phage	3.4e-51	44.2
WP_006778725.1\|4331880_4332204_-	hypothetical protein	A0A222YXE6	Synechococcus_phage	2.0e-13	37.5
WP_138670281.1\|4332200_4332950_-	nucleotidyl transferase	A0A1D8KNV9	Synechococcus_phage	1.8e-52	41.9
WP_006778727.1\|4332949_4333585_-	HAD family phosphatase	M1HXP3	Paramecium_bursaria_Chlorella_virus	5.2e-37	41.1
WP_006778728.1\|4333571_4334207_-	hypothetical protein	A0A2H4UUJ1	Bodo_saltans_virus	1.7e-11	29.2

Anti-CRISPR protein detection

Acr ID	Acr position	Acr size	Homology with known anti	Neighbor HTH/AcRanker	Neighbor Aca	In prophage	Protospacer in prophage

Overview of predicted results

Overview of the results

Cas Category Instructions

Results visualization

1. NZ_CP040506

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection