CRISPRimmunity

Please click to download your results

Overview of predicted results

Overview of the results

Contig_ID	Contig_def	CRISPR array number	Contig Signature genes	Self targeting spacer number	Target MGE spacer number	Prophage number	Anti-CRISPR protein number
NZ_AP017372	Halorhodospira halochloris strain DSM 1059	11 crisprs	Cas9_archaeal,c2c9_V-U4,DEDDh,cas3,cas8e,cse2gr11,cas7,cas5,cas6e,cas1,cas2,csa3,DinG,RT,cas6,WYL,csx16,csx1,cas10,csm2gr11,csm3gr7,csm4gr5,csm5gr7	1	26	4	0

Results visualization

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Crispr_ID: NZ_AP017372_1

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_AP017372_1

306593-306723

Orphan

Consensus_repeat	Method
GGAGGCTTCATGGCGCCATCCCGGCGCCAAGACCTC	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_AP017372_1

>merge|NZ_AP017372|1|306593-306723|CRISPRCasFinder
GGAGGCTTCATGGCGCCATCCCGGCGCCAAGACCTCTACGAATCCCCCGGAGCCATTTGCTACCCCGGTGTGGAGGACGCCGTGAATCCATCCCTGGAGGCTTCATGGCGCCATCCCTGGCGCCAAGACCT

>NZ_AP017372|1|1|306593-306723|CRISPRCasFinder
GGAGGCTTCATGGCGCCATCCCGGCGCCAAGACCTC	TACGAATCCCCCGGAGCCATTTGCTACCCCGGTGTGGAGGACGCCGTGAATCCATCCCT
GGAGGCTTCATGGCGCCATCCCTGGCGCCAAGACCT

Protein	Signature genes	Signature genes Name	Protein_function
NZ_AP017372.2\|WP_096407439.1\|303040_306493_+\|AAA-family-ATPase	unknown	unknown	gnl\|CDD\|227061
NZ_AP017372.2\|WP_096407452.1\|315358_316078_-\|Crp/Fnr-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|223736
NZ_AP017372.2\|WP_096407429.1\|296660_296873_+\|heavy-metal-associated-domain-containing-protein	unknown	unknown	gnl\|CDD\|238219
NZ_AP017372.2\|WP_096407432.1\|297114_299355_+\|copper-translocating-P-type-ATPase	unknown	unknown	gnl\|CDD\|319783
NZ_AP017372.2\|WP_096407444.1\|311767_312817_-\|alpha/beta-fold-hydrolase	unknown	unknown	gnl\|CDD\|132100
NZ_AP017372.2\|WP_096410284.1\|294686_295124_+\|universal-stress-protein	unknown	unknown	gnl\|CDD\|366180
NZ_AP017372.2\|WP_096407462.1\|319400_320219_+\|co-chaperone-DjlA	unknown	unknown	gnl\|CDD\|236512
NZ_AP017372.2\|WP_096407457.1\|317581_319036_-\|deoxyribodipyrimidine-photo-lyase	unknown	unknown	gnl\|CDD\|223492
NZ_AP017372.2\|WP_096407455.1\|316667_317558_-\|phosphoribosylaminoimidazolesuccinocarboxamide-synthase	unknown	unknown	gnl\|CDD\|237571
NZ_AP017372.2\|WP_096407437.1\|301724_303044_+\|DNA-repair-exonuclease	unknown	unknown	gnl\|CDD\|277319
NZ_AP017372.2\|WP_096407427.1\|295798_296674_+\|ion-transporter	unknown	unknown	gnl\|CDD\|366146
NZ_AP017372.2\|WP_096407449.1\|314215_315226_+\|type-I-glyceraldehyde-3-phosphate-dehydrogenase	unknown	unknown	gnl\|CDD\|223135
NZ_AP017372.2\|WP_096407419.1\|292238_292508_-\|hypothetical-protein	unknown	unknown	unknown
NZ_AP017372.2\|WP_162549277.1\|311614_311755_+\|hypothetical-protein	unknown	unknown	unknown
NZ_AP017372.2\|WP_096407434.1\|299373_301641_-\|UPF0149-family-protein	unknown	unknown	gnl\|CDD\|235521
NZ_AP017372.2\|WP_096407424.1\|295239_295698_-\|Hsp20/alpha-crystallin-family-protein	unknown	unknown	gnl\|CDD\|223149
NZ_AP017372.2\|WP_096407422.1\|292509_294348_-\|carbon-starvation-protein-A	unknown	unknown	gnl\|CDD\|224877
NZ_AP017372.2\|WP_096410285.1\|307795_311476_+\|PD40-domain-containing-protein	unknown	unknown	gnl\|CDD\|143478
NZ_AP017372.2\|WP_096407442.1\|306887_307202_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|273344
NZ_AP017372.2\|WP_096407447.1\|312818_313982_-\|methionine-adenosyltransferase	unknown	unknown	gnl\|CDD\|235374

Protein	Function_ID	Function_description	E-value
NZ_AP017372.2\|WP_096407439.1\|303040_306493_+\|AAA-family-ATPase	gnl\|CDD\|227061	COG4717, COG4717, Uncharacterized conserved protein [Function unknown].	7.50358e-20
NZ_AP017372.2\|WP_096407452.1\|315358_316078_-\|Crp/Fnr-family-transcriptional-regulator	gnl\|CDD\|223736	COG0664, Crp, cAMP-binding proteins - catabolite gene activator and regulatory subunit of cAMP-dependent protein kinases [Signal transduction mechanisms].	1.73781e-37
NZ_AP017372.2\|WP_096407429.1\|296660_296873_+\|heavy-metal-associated-domain-containing-protein	gnl\|CDD\|238219	cd00371, HMA, Heavy-metal-associated domain (HMA) is a conserved domain of approximately 30 amino acid residues found in a number of proteins that transport or detoxify heavy metals, for example, the CPx-type heavy metal ATPases and copper chaperones. HMA domain contains two cysteine residues that are important in binding and transfer of metal ions, such as copper, cadmium, cobalt and zinc. In the case of copper, stoichiometry of binding is one Cu+ ion per binding domain. Repeats of the HMA domain in copper chaperone has been associated with Menkes/Wilson disease due to binding of multiple copper ions.	6.54702e-11
NZ_AP017372.2\|WP_096407432.1\|297114_299355_+\|copper-translocating-P-type-ATPase	gnl\|CDD\|319783	cd02094, P-type_ATPase_Cu-like, P-type heavy metal-transporting ATPase, similar to human copper-transporting ATPases, ATP7A and ATP7B. The mammalian copper-transporting P-type ATPases, ATP7A and ATP7B are key molecules required for the regulation and maintenance of copper homeostasis. Menkes and Wilson diseases are caused by mutation in ATP7A and ATP7B respectively. This subfamily includes other copper-transporting ATPases such as: Bacillus subtilis CopA , Archeaoglobus fulgidus CopA, and Saccharomyces cerevisiae Ccc2p. This subclass of P-type ATPase is also referred to as CPx-type ATPases because their amino acid sequences contain a characteristic CPC or CPH motif associated with a stretch of hydrophobic amino acids and N-terminal ion-binding sequences. This subfamily belongs to the P-type ATPases, a large family of integral membrane transporters that are of critical importance in all kingdoms of life. They generate and maintain (electro-) chemical gradients across cellular membranes, by translocating cations, heavy metals and lipids, and are distinguished from other main classes of transport ATPases (F- , V- , and ABC- type) by the formation of a phosphorylated (P-) intermediate state in the catalytic cycle.	0
NZ_AP017372.2\|WP_096407444.1\|311767_312817_-\|alpha/beta-fold-hydrolase	gnl\|CDD\|132100	TIGR03056, bchO_mg_che_rel, putative magnesium chelatase accessory protein. Members of this family belong to the alpha/beta fold family hydrolases (pfam00561). Members are found in bacterial genomes if and only if they encoded for anoxygenic photosynthetic systems similar to that of Rhodobacter capsulatus and other alpha-Proteobacteria. Members often are encoded in the same operon as subunits of the protoporphyrin IX magnesium chelatase, and were once designated BchO. No literature supports a role as an actual subunit of magnesium chelatase, but an accessory role is possible, as suggested by placement by its probable hydrolase activity. [Energy metabolism, Photosynthesis].	1.50016e-78
NZ_AP017372.2\|WP_096407434.1\|299373_301641_-\|UPF0149-family-protein	gnl\|CDD\|235521	PRK05590, PRK05590, hypothetical protein; Provisional.	1.37939e-12
NZ_AP017372.2\|WP_096410284.1\|294686_295124_+\|universal-stress-protein	gnl\|CDD\|366180	pfam00582, Usp, Universal stress protein family. The universal stress protein UspA is a small cytoplasmic bacterial protein whose expression is enhanced when the cell is exposed to stress agents. UspA enhances the rate of cell survival during prolonged exposure to such conditions, and may provide a general "stress endurance" activity. The crystal structure of Haemophilus influenzae UspA reveals an alpha/beta fold similar to that of the Methanococcus jannaschii MJ0577 protein, which binds ATP, though UspA lacks ATP-binding activity.	1.47871e-26
NZ_AP017372.2\|WP_096407462.1\|319400_320219_+\|co-chaperone-DjlA	gnl\|CDD\|236512	PRK09430, djlA, co-chaperone DjlA.	2.11436e-58
NZ_AP017372.2\|WP_096407455.1\|316667_317558_-\|phosphoribosylaminoimidazolesuccinocarboxamide-synthase	gnl\|CDD\|237571	PRK13961, PRK13961, phosphoribosylaminoimidazole-succinocarboxamide synthase; Provisional.	0
NZ_AP017372.2\|WP_096407437.1\|301724_303044_+\|DNA-repair-exonuclease	gnl\|CDD\|277319	cd00840, MPP_Mre11_N, Mre11 nuclease, N-terminal metallophosphatase domain. Mre11 (also known as SbcD in Escherichia coli) is a subunit of the MRX protein complex. This complex includes: Mre11, Rad50, and Xrs2/Nbs1, and plays a vital role in several nuclear processes including DNA double-strand break repair, telomere length maintenance, cell cycle checkpoint control, and meiotic recombination, in eukaryotes. During double-strand break repair, the MRX complex is required to hold the two ends of a broken chromosome together. In vitro studies show that Mre11 has 3'-5' exonuclease activity on dsDNA templates and endonuclease activity on dsDNA and ssDNA templates. In addition to the N-terminal phosphatase domain, the eukaryotic MRE11 members of this family have a C-terminal DNA binding domain (not included in this alignment model). MRE11-like proteins are found in prokaryotes and archaea was well as in eukaryotes. Mre11 belongs to the metallophosphatase (MPP) superfamily. MPPs are functionally diverse, but all share a conserved domain with an active site consisting of two metal ions (usually manganese, iron, or zinc) coordinated with octahedral geometry by a cage of histidine, aspartate, and asparagine residues. The MPP superfamily includes: Mre11/SbcD-like exonucleases, Dbr1-like RNA lariat debranching enzymes, YfcE-like phosphodiesterases, purple acid phosphatases (PAPs), YbbF-like UDP-2,3-diacylglucosamine hydrolases, and acid sphingomyelinases (ASMases). The conserved domain is a double beta-sheet sandwich with a di-metal active site made up of residues located at the C-terminal side of the sheets. This domain is thought to allow for productive metal coordination.	2.475e-27
NZ_AP017372.2\|WP_096407427.1\|295798_296674_+\|ion-transporter	gnl\|CDD\|366146	pfam00520, Ion_trans, Ion transport protein. This family contains sodium, potassium and calcium ion channels. This family is 6 transmembrane helices in which the last two helices flank a loop which determines ion selectivity. In some sub-families (e.g. Na channels) the domain is repeated four times, whereas in others (e.g. K channels) the protein forms as a tetramer in the membrane.	3.17069e-40
NZ_AP017372.2\|WP_096407449.1\|314215_315226_+\|type-I-glyceraldehyde-3-phosphate-dehydrogenase	gnl\|CDD\|223135	COG0057, GapA, Glyceraldehyde-3-phosphate dehydrogenase/erythrose-4-phosphate dehydrogenase [Carbohydrate transport and metabolism].	1.41502e-178
NZ_AP017372.2\|WP_096410285.1\|307795_311476_+\|PD40-domain-containing-protein	gnl\|CDD\|143478	cd07562, Peptidase_S41_TRI, Tricorn protease; serine protease family S41. The tricorn protease (TRI), a member of the S41 peptidase family and named for its tricorn-like shape, exists only in some archaea and eubacteria. It has been shown to act as a carboxypeptidase, involved in the degradation of proteasomal products to preferentially yield di- and tripeptides, with subsequent and final degradations to free amino acid residues by tricorn interacting factors, F1, F2 and F3. Tricorn is a hexameric D3-symmetric protease of 720kD, and can self-associate further into a giant icosahedral capsid structure containing twenty copies of the complex. Each tricorn peptidase monomer consists of five structural domains: a six-bladed beta-propeller and a seven-bladed beta-propeller that limit access to the active site, the two domains (C1 and C2) that carry the active site residues, and a PDZ-like domain (proposed to be important for substrate recognition) between the C1 and C2 domains. The active site tetrad residues are distributed between the C1 and C2 domains, with serine and histidine on C1 and serine and glutamate on C2.	3.22372e-65
NZ_AP017372.2\|WP_096407424.1\|295239_295698_-\|Hsp20/alpha-crystallin-family-protein	gnl\|CDD\|223149	COG0071, IbpA, Molecular chaperone (small heat shock protein) [Posttranslational modification, protein turnover, chaperones].	6.65219e-37
NZ_AP017372.2\|WP_096407422.1\|292509_294348_-\|carbon-starvation-protein-A	gnl\|CDD\|224877	COG1966, CstA, Carbon starvation protein, predicted membrane protein [Signal transduction mechanisms].	9.44545e-164
NZ_AP017372.2\|WP_096407457.1\|317581_319036_-\|deoxyribodipyrimidine-photo-lyase	gnl\|CDD\|223492	COG0415, PhrB, Deoxyribodipyrimidine photolyase [DNA replication, recombination, and repair].	2.49625e-145
NZ_AP017372.2\|WP_096407442.1\|306887_307202_-\|hypothetical-protein	gnl\|CDD\|273344	TIGR00927, retinal_rod, K+-dependent Na+/Ca+ exchanger. [Transport and binding proteins, Cations and iron carrying compounds].	0.00515261
NZ_AP017372.2\|WP_096407447.1\|312818_313982_-\|methionine-adenosyltransferase	gnl\|CDD\|235374	PRK05250, PRK05250, S-adenosylmethionine synthetase; Validated.	0

>NZ_AP017372.2|WP_096407439.1|303040_306493_+|AAA-family-ATPase
MRLTRLEIQTLPGIEPGFAITDFGPGLNLVTGPNGSGKSSLIRALQALVVEPGPDDHFAIAVAASFSGDGQWTVRRTGQQQVWELDGRPAHSPRLPRRDVLRCYWLTMEDLLVADERDDRLGAELRRSLAGGYDLVALRNEEQFRVGKQNGVREAKALREAQAEQRRVEAEYADLYRQEAQLPELDEQIDAARRAAGRSEQLRQALALLQARRRRQQVEAVLADFATGLERLRGDEMERLNKLEQRRLNLEHELRRQGERREQARDQLAAAGFGDTPRPQAVELDSARDELEEARRAQEQLDQEQRQLERARASEQRARAELAGTANTEQSNPESANLISPQALHEAESLARRLQRCQAQQADLQGKLEGMPAATFATSHVELYWQAAHALRVWLAVGGFDARLLYAVLALALAGCGAAGVGAYQVEDWIALGGSVLAGLGIAAAGWLAPSDDRRAAQQRFSETGLQAPSRWRADAVRERLQELETARADLQRRQADAERAAELRNALQQVDKELAELEAERHELGHRLGFDPQLTAAALDRFVRLSEQLDRARDEGAAAQENCRRLEKTLEKSLARVRQHLAASGVECSAATGGLVELESALHELRERSRRAESAEREYHQAHSEQQRLERELDELASERGQLFEQAGLEEDQRDELARRCEQHPAWREQRDRLREAAAVEAERRSALASDEQLLSRVDSGDEQGLQAELEQAENEAAELEKLRDQASTIRTRLHDAGRDWRLEQAMAATESRQAALHERFAEGLFAEAAQVLLDNVEREHRQHHEPQVLSDARDRFRRFTRHNYDLCLGEDFTFFARDLSQQVDRDLGELSTGTRMQLLLAVRLAWADQLEQDRESLPLFLDEALTASDEERFVLIGATLGQMAREEGRQVFYLSARRHELPLWQRAVGELPHVIDLAQIRFGAASDSAQVDFALPERDPVPAPGEQEPAYDYAQRIGVPAIAPRAPAGSMHIFHLLRDDLPLLHRLLEDWRTMTLGQFEGLLDSSAAPAVIAAQTERQRLRGRCSVARLWLNAWRYGRGTPVDRTVLERSAAVSATFIDRVAELCDGLSGDGEALIEALRNGEVRRFQSSKIDELAQWLEDEGYIDPATPLDAEARERQVVQDAAMIASVDEIRRVVAWLEAGLAAA
>NZ_AP017372.2|WP_096407437.1|301724_303044_+|DNA-repair-exonuclease
MPVKILASADLHLGRRPSRLPESLRSSSRELGPAGVWSKMVDAALEAEVDVVVLAGDVVEHENDFYEAYRELYQGVQRLSAGGIKVYAVVGNHDVHVLPRLAGQIENIELLGRAGEWESVTLQVKSERVTFWGWSFPRPQVTYSPLAGQRLERGAGPNIGVLHCDRGQSSSPYAPVAEGELVAAGVDCWLLGHTHAADDCSYDYKSAYSGDGLGGYLGGYLGSPVGTDPGEPGAHGPWLITIEGGQIGRIEQWPLAALRWEELRVDLSAITAAEQARERVLEVARDLDQQLQDAPPQAVGLRVVLGGQSDLGSEAVALFGDEARDHLLNGAAGTHYFIERVQLATRPSIDLAELAADSDPPGLLARQLLLLERPLDDPQRQQLIAEARRRLQERAREARWQEISPATIDDEQAAEWLRQAGLRILERLRAQQPQEEAEQ
>NZ_AP017372.2|WP_096407434.1|299373_301641_-|UPF0149-family-protein
MKDHEYPPYEESISFHSQIRRLVEDDDLQDEEVLDGLLSIVTSDLPAELEIQIDSPRPESVAELYEAIEDHGPEIPKNLFIDMAWRLASRQEDIWQRLALYWALDTLWELRHIVLLCFLSHAQDQTLSPYVRARLPIIAHWLPDEECAELVADIIDDAPTDGSSAKPVFEQQASVDGIYLSIPEGGALQHLAITGHNEGEHFLGLVELEVDSGFYSVETLCGLDQRQLSEELELLQIDSPLGEATPDIAIALLNNALASQLESEEPPPASLIDLVTIFALQGQIAPEPISTRQWLDILDPDNKLESLTPQKRGRLINQSAKWAEQFPIVDTWFDDNPESASIIDAYSSPNKRELELRRHLDVDRRPWWAEHCFRSALALQQGWNQDTWMSFAAVGKALLDGRELRKIPIFDSILSATLEAHERGCRCSGSSKLDEDLDGDPFSDPSLRPESLHIPDKLRQSLEGFYNREHAKAVWDSGFMGLHGYLFAIATHPEPISPSEWLGPLLNPDDQSQAGVAANKAEFSEIIGNLLQLYNVINSQVFEGVAELPEGCTLKSEPMDNFHPDAPVSQWARGFRTARRCFGHLLDWLDEAREDMPQNSQERENWEMEVAEVCGFSTMALEIFADRQKAERVCRGAQEDNEKTTIENMAKFAHTTFYESFSDIAIFAGTLRRDIDSDDDEQGSMGMPAGTAANASEKGEPRLDQIPFSTPSTQPPQQPGPQQPARSNKVGRNEPCPCGSGKKYKRCCGDPRNSH
>NZ_AP017372.2|WP_096407432.1|297114_299355_+|copper-translocating-P-type-ATPase
MAEQSLELVIEGMTCASCVARVERMATRLPGVHSASVSLPTERATISFDPAQVDSEQIIEAISKGGFKATVRRDQERSMPDSARELGSLWRDLWLAVALTIPLVAVAMGPMLLPGLDSAMQQVLAERSWLWVEWLLVTPVLLWAGRRFFARGAPALLRLHPEMNSLVMLGTSAAWLYSTTVLLWPELFPEQARGVYFEAVGVIITLVLVGRYFELKSRGQASQAIRRLLELQVPSARVIRQGREEEVEVKRLEPGDQVVVRPGERLPVDGRIIEGSSYIDESMVTGEPVPVARGVGDEVVGGTVNRSGSFTFAASRVGADTVLGQIVRMVEGAQASKPPIQSLVDRVAGWVVWAAIALAIGAALSWSLLGFGIDHALVVAAAVLLIACPCAMGLATPMAIMVGTGRGAEQGILFRRGAAFQASAGVNVVVMDKTGTLTVGRPVLTDIEPADGFMADDVLVQAAAVEGRSEHPLAEAIVAAAHARNLGVAEVADFAAVPGYGVQGKVDGEEIVVGARRFLNQLQIMVPRGLHERAAELAKQGRTPLFVAIGGRVAALLAVADPIKEGSKPAINALHSMGLRTVMLTGDDRETADAVARQIGITEVKADVLPADKEAVIGEMQSKGLRVAFVGDGINDAPALARADVGVAVGTGTDVAIEAGDVVIMAGDPRSMARGLSLARRTFRTIRQNLFWAFVYNITLMPVAAGVLYPLWGVLLSPMMAAAAMSLSSLLVVSNSLRLRRVELVR
>NZ_AP017372.2|WP_096407429.1|296660_296873_+|heavy-metal-associated-domain-containing-protein
MEAVKIRIEGMSCSHCEASVREVLETLPGVEQVIEVSAEAQQAQVKGRPDPALVAQRLEEIGFAGMVTDD
>NZ_AP017372.2|WP_096407427.1|295798_296674_+|ion-transporter
MFSSGDNNSQHNYSAGLRGRIQWLVETPWFQNTIIVLICINGVTLGLVTSDDIKAWAGGLIPLINQVIIGVFVVEVALRIVAWGPRFFRGPWNLFDFFVVAIALVPDGGAYSVLRALRILRLLRLISQVGRLRIIVESLLRALPGIGWIGVLLLLVYYVFAVMGTELYGESFPEFFGTVGLSMYTLFQVMTLESWSEAIARPVMEQYAGAWFYFVTFILVSAFTVLNLFIGIIVNSMQSLHWEEEEEKRMESEGKAHTEREEMLHQIKEMNAKIDRLERRLSNNGERDGSG
>NZ_AP017372.2|WP_096407424.1|295239_295698_-|Hsp20/alpha-crystallin-family-protein
MAMMRYDPLNTLRQLQTDLDRIFSAGSQGMLGTPSENGESASNWMPAVDIAEDDKAYHVHVDLPGVDAENIDVAMDNGMLTIKGYREDNKSEDGPNWKRVERVRGTFFRRFTLPENVDADNIQARCRNGVLEVAVPKREEQPGKRIKVEQAS
>NZ_AP017372.2|WP_096410284.1|294686_295124_+|universal-stress-protein
MSEIVVGLDGSEGSQRALEWAVDEARLRSTGVRAVYVIDRRYLDSELGVLVAQPASELEAEAHGIVDRAIESLSAADDVAIDKHVLHAKDHGVVGTLLDQIGADAQLLVVGSRGHGGFAGLLLGSVSHQILQHAPCPVVVVPYRR
>NZ_AP017372.2|WP_096407422.1|292509_294348_-|carbon-starvation-protein-A
MSAIWLAMAALALYIFGWLWYSRYLANHIYRLDPNFITPAHRYRDGVDFVPTNKWILWGHHFTSVAGAAPIIGPAIAIYWGWGPALAWVALGTVFAAGVHDFGALVLSNRHRGQSIGTMANRIIGRRAKILFLFIILILILMVNAVFAWAIANLFINNPSAVLPVILQIPVAIWIGYKVLRRGGNLLLPSIIALALMYGTAVVTTYVEWLQIDLVRWFGGEGASTFVFGLEATPASFLIWILALLGYVYVASTLPVWKLLQPRDYINAQQLIVGLAILYLGLLLTQPQVTAPIYNNAAETSWFPLLFITIACGAISGFHGLVASGTSSKQLDREPDARTVGYLGALGEGILALIAIIAVATVFASQSEFLDSYSSFAKAGDVGIGNFVEGASVLASGVGIPSEIAATIVALIIVCFAATTLDSAVRLLRYIIGELGNEYRVHHLTRRHIGTSLAIGMTALLALVPDGGQGVGSGGYLLWPLFGTSNQLLAGITLMLISLWLFRQGRNPLPTLVPMIFLLAMTIWALTQQLVLDWSGVGEADAQWLLFALGAIILGFAVWILLEAIRLFYHREELEALRDPADETAEETNDSAENGRPTGKGQQTEQTDKGES
>NZ_AP017372.2|WP_096407419.1|292238_292508_-|hypothetical-protein
MAQKLRERLAAFASGYDRMLRLGHEAEVRRELAEREDLIMLMLFSETMGLPNPASYYTLELYPALIESYHQWHKRMGMEHSPLDHVRCC
>NZ_AP017372.2|WP_096407442.1|306887_307202_-|hypothetical-protein
MQNKTFLATLLASAFALASTSALAFDAAEGEDAGDPWAEPAGEEMEQDEGEAAQDPWGQPEEEAAEDPWGQPEGEAADPFGEPAEEGDTEGGEDLDDFEGGQQW
>NZ_AP017372.2|WP_096410285.1|307795_311476_+|PD40-domain-containing-protein
MGCFTVLTAAEREAVELPRFPSLSPDGEEIVFSWGGDLWRVGSDGGEATRLTAHQFDDLYSSWSGNGQWLVFNSMRDGYLNLYRMRRDGSELSQLTYSDRFIRSPDYSEDSDGEPVITFSSYLEGDVYREQRPYSLSPQGGEHSRLLEAFGSEPRLSPNGERVVFTRGGYYHGWNRRHYQGPEARNIWVYDFASEQFSAITSRDGDDGRARWLDDETLIFMSDREDRTVNLYRVALTENGSCDSQQDSADEPCEPISAAQAERLTPFDERDVRYFDVAPDAEKAVLQVWDSLYTLDLADPEAEPVKLSLRAGEVGRDKHELRRIDRDVTEAALSPDGQVMAYIAYGRVYVRNLDEHSPTRRVSPPNHARHKDLAWSPDGLTLYFTSDADGSESIYAARVLLTRDEIEQAYQQPGYELPTAAIDELPATRAPIAEEEADQQRPDEPERQQPERQPRQEDQRPADAENDSGASGVDEDPFGPHEPPDPIDPQPDPDPADPDPMGPDPLDPQPDPVEPEPSEPVADPDTVPEDELTDEVAEDADVEGLLDPERWHEAVQFVVSPLIADEQSSDRQASPSPDGNYLAFRRGRGDLKIKDLSSGEIEKLVPGWDSSIEWRWSPDSRYIAYSQNDLNFAANIFVVPVDGSHEPVNITRHPRNDLNPRWSQDGRKLAFISNRSNETYDIYRVYLDRGLERYSPRDITRYYRDSRRAAGQLEPLPVDLDERAAKLEELEEQPAELDLENAWRRVERVTATPVNEYALEITPGGDRYTFNRSGEGLMLRSWDGSESKRLGGVASVQQLSLTGDRLVYVSGGRAGVVKLDNAKHERPDISDRLRIDLREQSLQKFHEAARVIEEGFYRPDMKGLDWQGLVADYESLIERARTPSEFSDIANQLMGELAASHMGVNNPGDYIQRREPSGRLGIEHERVELADGVSGYRVLSLVPEGPAAEEPMPLRPGDVITAVEQQRFAGDESLLQVLRGRVGKELLITFRRPDDGPNVERQALITPISFSELARLKYDDFKRRSRNKVAELSEGRLGYVHIQAMNHVSLERFQADLYAAAHGKEGLIIDVRNNGGGHTTDRILTSLMSPVHAFTLPAGADENETGHYPQDRLDAPRYTAPANMLANEKSYSNAEILAHAFRTLNRGTLVGEQTYGGVISTGSRTLIDGATVRRPFRGWYLPDGTDMEHNGAQPDIHIEQRPEDEVAGRDRQLEKAVEDLLERLDS
>NZ_AP017372.2|WP_162549277.1|311614_311755_+|hypothetical-protein
MNPSLEASWRHPWRQDLHTGVAGCGSRGVLEATPETDLRCPNMCAY
>NZ_AP017372.2|WP_096407444.1|311767_312817_-|alpha/beta-fold-hydrolase
MSIKRFFMRMPTPILVGLLIVIILLGASVACSLGSGGQEQAAETSADGENADPPRFPRWDVEGRDWPGRESSRFVEINGINWHYQVYGDGPVLLLVHGTAAASHSWHPLIAELAEHFTVINLDLPGHGFTSRPDAERFVMTEMAADLGDLLDHIGYQPELVVGHSAGAALLARMVVDGHISPQALISINGSFIRRQGPIGRFFAPVGRWIFESDRAANFFAGRVEDQQTVADALERMGTNLDERQVELYTRLVRTPGHIGSALRMMARWQLYELEPHLSKLDLPVVLVAGEEDGLVDPDEAVDVANRMPRASVIRLDGLGHFAHEEDPARTLEIIFNIADAKLQESFAR
>NZ_AP017372.2|WP_096407447.1|312818_313982_-|methionine-adenosyltransferase
MDEHYLFTSESVSQAHPDKIADQISDTILDAVLEADPHGRVACETAVKTGMVLLFGELTTAAEVDFETLVRDKVCELGYNHSQLGFDGNTCAVINALGQQSPDIALGVDRTDPEQQGAGDQGLMFGYATDETETLMPAPIQYAHRLMQRHSQLLQETTLQWLRPDAKAQVTFSYADGQPQAIDTVVLSTQHAADVDLETVREAVIEQIVKPVLPQQWLSAETRFLINPTGRFVVGGPLGDAGLTGRKVVVDTYGGVARVGGGCFSGKDPSKVDRSAAYACRYVAKNIVAAGLARRCEVQLSYAIGIAEPVSINVETFGTGKLPRAKLVELVRNHFDLRPYGIIRSLDLLRPIYAKTAAHGHFGREETGFTWERTDMAQTLADSAANI
>NZ_AP017372.2|WP_096407449.1|314215_315226_+|type-I-glyceraldehyde-3-phosphate-dehydrogenase
MTINVAINGYGRIGRNVLRALYESGRNDEIRIVAINDLGDAETNAHLTRYDTAHGRFPGDVKVEGGDLVVNGDRIKVCAERNPADLPWGDLGVDVVMECTGLFTSKEKAGAHIQAGAKKVLISAPGGKDVDGTVVYGVNQGVLTSGHEVISNASCTTNCLAPMVKAIQDKIGVEQGLMTTIHAYTNDQVLTDVYHSDLRRARSATHSQIPTKTGAAAAVGLVLPELNGKLDGFAIRVPTINVSLVDLTFTASRDTSVDEVNQVVKAAAGGELSGVLAYNEDPLVSIDFNHNPASSVFDATLTRAMGSRLIKACAWYDNEWGFSNRMLDTTVAMMRA
>NZ_AP017372.2|WP_096407452.1|315358_316078_-|Crp/Fnr-family-transcriptional-regulator
MEPNDCRNCEIRSLALFGEISSEGVDQFAEQTYQVQYPAGATIYEQGDKPEAAFTLREGIIKLVRNSGTDRSQIVRLLVKGDLMGIEGIFEEPYRQSAIALTPVRVCYLPLPMLDRMRTEEPRFTEALLGRWRRALNEVEELAVELGTRKAEERVAAFLLHWQEKAEHDDDNWMPFPLSRTELGQMLGLRVETVSRVLARWKREGIFEERSSRLRLLEPDCLDQLLAQGTETATAAHRE
>NZ_AP017372.2|WP_096407455.1|316667_317558_-|phosphoribosylaminoimidazolesuccinocarboxamide-synthase
MQNNNALYSSTLTSLELLHSGKVRDIYAIDEDRLMIVATDRLSAFDVILPDPIPGKGAVLTRLSNFWFRHTAGIADNHLLDDDPHEFLTPQESELLGDRAVVVKRLRPLPVEAIVRGYLAGSGWQSYQQDGTVSGVALPAGLQQSQRLPQPIFTPSTKAQLGEHDEAISFAQTAELIGEELAEQIRTISLRVYEHACIHAEKCGLIIADTKLEFGLGEDGQPVIIDELLTPDSSRFWPADAWQPGTTPPAFDKQFIRDHLETLGWNKEPPAPSLSADVIAKTAEKYSEAERRLVVS
>NZ_AP017372.2|WP_096407457.1|317581_319036_-|deoxyribodipyrimidine-photo-lyase
MPQTAIIWLRRDLRLQDQPAFAAATKIADYVLPLYIHAPHEERPQAGAASRWWLHHSLSSLRQELRERGSDLFLDSGSSTSTLMRWAQANSASLVLCTAISEPWAEERDNKTAAELAQAGIELRITADGLLTDPHAIRNRSNTPYRAFTPFWRQVRGQLNPPQAKPAPTSLPPPPGHAHNSSAELEQLNLLDRVRWYDKFADYWQPGSTAASHRLARLSPEFFAAYPDERDFPAQPGTSLLSPHIHFGELSIREVWHQAAHSQPENHSGPANHSGVETYLAELGWREFAYHLLTQQPNLHSYPVDRRFAAMPWRDDPDNSLYSAWHLGQTGIPLVDAGMKELWATGWMHNRVRMVVGSFLVKNLRLPWQLGEEYFRDTLVDWDLASNSMGWQWVAGCGADAAPYFRIFNPVRQGERFDPEGEYVRRWLPQLGALNKKQIHQPWTAPAATLDSAGIRLGKDYPWPITDLQSSRREALEAFQSIKG
>NZ_AP017372.2|WP_096407462.1|319400_320219_+|co-chaperone-DjlA
MQLYRIIQNWLGRILGALAGGLAAGPLGIALWLGIVLGFLAGYGVDVWVRVTQVVGLVWSRCGLGFDQRVFIGTTAMVMGYVAKHDGRVSEAEISAARRVLNELPLDELGRKRAITVFNRGKDPGAPLRWILLMLRTVGRRRPEELARFLDFQLRVAAADGLPDAGREKLLRWIWRHVGVSGVDLDARLDGMRRGKLNRTVRPTIDHAYKLLGVSRNASSEQVRKAYRRAISKSHPDRMVGNGHSEQEIEEASERTRQIRAAYEAIREVRGS

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_AP017372_2

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_AP017372_2

346492-346615

Orphan

Consensus_repeat	Method
TTGTGCCTGTCCCCTTAATCTCTGTGCCTGTCCCCCT	PILER-CR

2 spacers

The CRISPR arrays of NZ_AP017372_2

>merge|NZ_AP017372|2|346492-346615|PILER-CR
TTGTGCCTGTCCCCTTCCTCACTGTGCCTGTCCCTCTCCAATCCATCTAAATCTCTGTGCCTGTCCCCCTGCAAATCCCCCTGATCATTGTGCCTGTCCCTTTGATCTCTGTGCCTGTCCCCCT

>NZ_AP017372|2|1|346492-346615|PILER-CR
TTGTGCCTGTCCCCTTCCTCACTGTGCCTGTCCCTCT	CCAATCCATCTAAA
TCTCTGTGCCTGTCCCCCTGCAAATCCCCCTGATCAT	TGTGCCTGTCCCTTTGA
TCTCTGTGCCTGTCCCCCT

Protein	Signature genes	Signature genes Name	Protein_function
NZ_AP017372.2\|WP_096407525.1\|359166_359364_+\|DUF2283-domain-containing-protein	unknown	unknown	gnl\|CDD\|378367
NZ_AP017372.2\|WP_096407521.1\|358004_358421_-\|PIN-domain-containing-protein	unknown	unknown	gnl\|CDD\|350222
NZ_AP017372.2\|WP_162549282.1\|359702_360023_-\|hypothetical-protein	unknown	unknown	unknown
NZ_AP017372.2\|WP_096407519.1\|357185_357506_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|227645
NZ_AP017372.2\|WP_096407481.1\|331436_331919_-\|RDD-family-protein	unknown	unknown	gnl\|CDD\|377640
NZ_AP017372.2\|WP_162549279.1\|333660_335085_-\|WD40-repeat-domain-containing-protein	unknown	unknown	gnl\|CDD\|238121
NZ_AP017372.2\|WP_096410287.1\|358420_358696_-\|type-II-toxin-antitoxin-system-Phd/YefM-family-antitoxin	unknown	unknown	gnl\|CDD\|376852
NZ_AP017372.2\|WP_096407506.1\|348458_349724_+\|glucose-1-phosphate-adenylyltransferase	unknown	unknown	gnl\|CDD\|234824
NZ_AP017372.2\|WP_096407499.1\|343968_344565_-\|DedA-family-protein	unknown	unknown	gnl\|CDD\|223659
NZ_AP017372.2\|WP_096407483.1\|332551_333151_-\|hypothetical-protein	unknown	unknown	unknown
NZ_AP017372.2\|WP_109962906.1\|344549_346085_-\|glycogen-synthase-GlgA	unknown	unknown	gnl\|CDD\|234809
NZ_AP017372.2\|WP_096407493.1\|340689_341673_-\|Rpn-family-recombination-promoting-nuclease/putative-transposase	unknown	unknown	gnl\|CDD\|368098
NZ_AP017372.2\|WP_096407511.1\|351473_353033_+\|4-alpha-glucanotransferase	unknown	unknown	gnl\|CDD\|237738
NZ_AP017372.2\|WP_162549281.1\|343528_343972_-\|rhodanese-like-domain-containing-protein	unknown	unknown	gnl\|CDD\|238089
NZ_AP017372.2\|WP_096407488.1\|336507_336900_+\|hypothetical-protein	unknown	unknown	unknown
NZ_AP017372.2\|WP_096407509.1\|349710_351477_+\|glycoside-hydrolase	unknown	unknown	gnl\|CDD\|212108
NZ_AP017372.2\|WP_162549280.1\|337940_338105_-\|hypothetical-protein	unknown	unknown	unknown
NZ_AP017372.2\|WP_096407514.1\|353393_355943_-\|alpha-glucan-family-phosphorylase	unknown	unknown	gnl\|CDD\|340852
NZ_AP017372.2\|WP_096407491.1\|336969_337461_-\|ammonia-forming-cytochrome-c-nitrite-reductase-subunit-c552	unknown	unknown	gnl\|CDD\|349426
NZ_AP017372.2\|WP_096407516.1\|356933_357164_-\|Rpn-family-recombination-promoting-nuclease/putative-transposase	unknown	unknown	gnl\|CDD\|368098

Protein	Function_ID	Function_description	E-value
NZ_AP017372.2\|WP_096407521.1\|358004_358421_-\|PIN-domain-containing-protein	gnl\|CDD\|350222	cd09874, PIN_MT3492-like, VapC-like PIN domain of the hypothetical protein MT3492 of Mycobacterium tuberculosis CDC1551 and other uncharacterized, annotated PilT protein domain proteins. Virulence associated protein C (VapC)-like PIN (PilT N terminus) domain of Mycobacterium tuberculosis CDC1551, hypothetical protein MT3492, and similar bacterial and archaeal proteins are included in this subfamily. They are PIN domain homologs of the Mycobacterium tuberculosis VapC and Neisseria gonorrhoeae FitB toxins of the prokaryotic toxin/antitoxin operons, VapBC and FitAB, respectively, which are believed to be involved in growth inhibition by regulating translation. These toxins are nearly always co-expressed with an antitoxin, a cognate protein inhibitor, forming an inert protein complex. Disassociation of the protein complex activates the ribonuclease activity of the toxin by an, as yet undefined mechanism. The PIN domain belongs to a large nuclease superfamily. The structural properties of the PIN (PilT N terminus) domain indicate its active center, consisting of three highly conserved catalytic residues which coordinate metal ions, in some members, additional metal coordinating residues can be found. Some members of the superfamily lack several of these key catalytic residues. The PIN active site is geometrically similar in the active center of structure-specific 5' nucleases, PIN-domain ribonucleases of eukaryotic rRNA editing proteins, and bacterial toxins of toxin-antitoxin (TA) operons.	7.42305e-11
NZ_AP017372.2\|WP_096407519.1\|357185_357506_-\|hypothetical-protein	gnl\|CDD\|227645	COG5340, COG5340, Predicted transcriptional regulator [Transcription].	0.000979442
NZ_AP017372.2\|WP_096407481.1\|331436_331919_-\|RDD-family-protein	gnl\|CDD\|377640	pfam06271, RDD, RDD family. This family of proteins contain three highly conserved amino acids: one arginine and two aspartates, hence the name of RDD family. This region contains two predicted transmembrane regions. The arginine occurs at the N-terminus of the first helix and the first aspartate occurs in the middle of this helix. The molecular function of this region is unknown. However this region may be involved in transport of an as yet unknown set of ligands (Bateman A pers. obs.).	1.11692e-21
NZ_AP017372.2\|WP_162549279.1\|333660_335085_-\|WD40-repeat-domain-containing-protein	gnl\|CDD\|238121	cd00200, WD40, WD40 domain, found in a number of eukaryotic proteins that cover a wide variety of functions including adaptor/regulatory modules in signal transduction, pre-mRNA processing and cytoskeleton assembly; typically contains a GH dipeptide 11-24 residues from its N-terminus and the WD dipeptide at its C-terminus and is 40 residues long, hence the name WD40; between GH and WD lies a conserved core; serves as a stable propeller-like platform to which proteins can bind either stably or reversibly; forms a propeller-like structure with several blades where each blade is composed of a four-stranded anti-parallel b-sheet; instances with few detectable copies are hypothesized to form larger structures by dimerization; each WD40 sequence repeat forms the first three strands of one blade and the last strand in the next blade; the last C-terminal WD40 repeat completes the blade structure of the first WD40 repeat to create the closed ring propeller-structure; residues on the top and bottom surface of the propeller are proposed to coordinate interactions with other proteins and/or small ligands; 7 copies of the repeat are present in this alignment.	1.5372e-38
NZ_AP017372.2\|WP_096410287.1\|358420_358696_-\|type-II-toxin-antitoxin-system-Phd/YefM-family-antitoxin	gnl\|CDD\|376852	pfam02604, PhdYeFM_antitox, Antitoxin Phd_YefM, type II toxin-antitoxin system. Members of this family act as antitoxins in type II toxin-antitoxin systems. When bound to their toxin partners, they can bind DNA via the N-terminus and repress the expression of operons containing genes encoding the toxin and the antitoxin. This domain complexes with Txe toxins containing pfam06769, Fic/DOC toxins containing pfam02661 and YafO toxins containing pfam13957.	0.000313243
NZ_AP017372.2\|WP_096407506.1\|348458_349724_+\|glucose-1-phosphate-adenylyltransferase	gnl\|CDD\|234824	PRK00725, glgC, glucose-1-phosphate adenylyltransferase; Provisional.	0
NZ_AP017372.2\|WP_096407499.1\|343968_344565_-\|DedA-family-protein	gnl\|CDD\|223659	COG0586, DedA, Uncharacterized membrane-associated protein [Function unknown].	8.14392e-30
NZ_AP017372.2\|WP_109962906.1\|344549_346085_-\|glycogen-synthase-GlgA	gnl\|CDD\|234809	PRK00654, glgA, glycogen synthase GlgA.	0
NZ_AP017372.2\|WP_096407509.1\|349710_351477_+\|glycoside-hydrolase	gnl\|CDD\|212108	cd10796, GH57N_APU, N-terminal catalytic domain of thermoactive amylopullulanases; glycoside hydrolase family 57 (GH57). Pullulanases (EC 3.2.1.41) are capable of hydrolyzing the alpha-1,6 glucosidic bonds of pullulan, producing maltotriose. Amylopullulanases (APU, E.C 3.2.1.1/41) are type II pullulanases which can also degrade both the alpha-1,6 and alpha-1,4 glucosidic bonds of starch, producing oligosaccharides. This subfamily includes GH57 archaeal thermoactive APUs, which show both pullulanolytic and amylolytic activities. They have an acid pH optimum and the presence of Ca2+ might increase their activity, thermostability, and substrate affinity. Besides GH57 thermoactive APUs, all mesophilic and some thermoactive APUs belong to glycoside hydrolase family 13 with catalytic features distinct from GH57. This subfamily also includes many uncharacterized proteins found in bacteria and archaea.	8.84336e-101
NZ_AP017372.2\|WP_096407511.1\|351473_353033_+\|4-alpha-glucanotransferase	gnl\|CDD\|237738	PRK14508, PRK14508, 4-alpha-glucanotransferase; Provisional.	0
NZ_AP017372.2\|WP_162549281.1\|343528_343972_-\|rhodanese-like-domain-containing-protein	gnl\|CDD\|238089	cd00158, RHOD, Rhodanese Homology Domain (RHOD); an alpha beta fold domain found duplicated in the rhodanese protein. The cysteine containing enzymatically active version of the domain is also found in the Cdc25 class of protein phosphatases and a variety of proteins such as sulfide dehydrogenases and certain stress proteins such as senesence specific protein 1 in plants, PspE and GlpE in bacteria and cyanide and arsenate resistance proteins. Inactive versions (no active site cysteine) are also seen in dual specificity phosphatases, ubiquitin hydrolases from yeast and in sulfuryltransferases, where they are believed to play a regulatory role in multidomain proteins.	1.54568e-12
NZ_AP017372.2\|WP_096407525.1\|359166_359364_+\|DUF2283-domain-containing-protein	gnl\|CDD\|378367	pfam10049, DUF2283, Protein of unknown function (DUF2283). Members of this family of hypothetical bacterial proteins have no known function.	1.17859e-14
NZ_AP017372.2\|WP_096407493.1\|340689_341673_-\|Rpn-family-recombination-promoting-nuclease/putative-transposase	gnl\|CDD\|368098	pfam04754, Transposase_31, Putative transposase, YhgA-like. This family of putative transposases includes the YhgA sequence from Escherichia coli and several prokaryotic homologs.	1.88179e-20
NZ_AP017372.2\|WP_096407514.1\|353393_355943_-\|alpha-glucan-family-phosphorylase	gnl\|CDD\|340852	cd04299, GT35_Glycogen_Phosphorylase-like, proteins similar to glycogen phosphorylase. This family is most closely related to the oligosaccharide phosphorylase domain family and other unidentified sequences. Oligosaccharide phosphorylase catalyzes the breakdown of oligosaccharides into glucose-1-phosphate units. They are important allosteric enzymes in carbohydrate metabolism.	0
NZ_AP017372.2\|WP_096407491.1\|336969_337461_-\|ammonia-forming-cytochrome-c-nitrite-reductase-subunit-c552	gnl\|CDD\|349426	cd00548, NrfA-like, cytochrome c nitrite reductase and similar proteins. This family contains cytochrome c nitrite reductase (also known as cytochrome c552, or NrfA) and similar proteins. The pentaheme enzyme NrfA catalyzes the electron reduction of nitrite to ammonia in the nitrogen cycle. This enzyme can also transform nitrogen monoxide and hydroxylamine, two potential bound reaction intermediates, into ammonia. It is a homodimer, with each monomer containing four classical CXXCH type heme-binding sites along with an alternative CXXCK heme-binding motif, which is important for catalysis. This family also includes octaheme nitrite reductase (TvNiR) from the haloalkaliphilic bacterium Thioalkalivibrio paradoxus which catalyzes the reduction of nitrite and hydroxylamine to ammonia as well as the reduction of sulfite to sulfide.	1.34526e-53
NZ_AP017372.2\|WP_096407516.1\|356933_357164_-\|Rpn-family-recombination-promoting-nuclease/putative-transposase	gnl\|CDD\|368098	pfam04754, Transposase_31, Putative transposase, YhgA-like. This family of putative transposases includes the YhgA sequence from Escherichia coli and several prokaryotic homologs.	5.71889e-11

>NZ_AP017372.2|WP_109962906.1|344549_346085_-|glycogen-synthase-GlgA
MPAYPSARERLEGPIKYLSLGSGAGSVKGQAQTSSTKGQAQSEGQAQISQSEGQAPGGGQAQPKGQAPTPSKGQAQSPAPSKGQAQSSNRYHKQKIIEGRLPGSEVSVWLLDDPELFERVGSPYATASGEPWPDNHLRFYWLSRVAAAIAAGEVLDWQADILHANDWQSALAPVFLQDYSESHQERPRTVFSIHNLAYRGIFSADVFAQLELPAAMWNPERLEFYGELAFIKGALTLSDAITTVSPTYAREIQTPAFGWGLDGLLRSRSSDLHGIINGVDTTTWDPATDPHLAANYSAPDPQAKAKNRQAIAVEIGLDDDPQSPLLGFIGRLVEQKGIDLILGALPRLLASGARLAILGSGDNTLERALLQAAQAHPGRVGVSIGYDEGQAHRIEAGSDIFLMPSRFEPCGLNQLYSLRYGTPPLVNPTGGLADTVLDVDAHAGGNGFCTAAADAGSLAATVERALSYWQDQEAWQKIQARGMSADYSWDRSADAYVDLYERIRATGWQRR
>NZ_AP017372.2|WP_096407499.1|343968_344565_-|DedA-family-protein
MAAEIIIEILEHLGLIGIFIAMIFIAPETLMPFLGYAASQGDYHPLAALAAASLGSTFGSTLIYYAARWLDRERMIWWLTLGGRWYLFKRSDIAAMDKVFSRHGALIVFFGRFLPTVRSVVSVPAGLLPMPMPKFLLFTFLGSTAWNSLLVLGGYTAGANWERMVEYLGTFGTLITFAFIALIIGFVLFRLRTLTLGK
>NZ_AP017372.2|WP_162549281.1|343528_343972_-|rhodanese-like-domain-containing-protein
MSLNSMDVNQKYRCPAIALLLTIAFLALPHPAHSNYYSVAPDPGDLLQFNGVLVDIREPYEWQQTGIVEGSKTITYRHTEDFIEHLEPHLNQELRPIALICRTGNRTRQAAHLLSQKVDAPVINIEGGIFRLMHLGYRPVPYQDEEP
>NZ_AP017372.2|WP_096407493.1|340689_341673_-|Rpn-family-recombination-promoting-nuclease/putative-transposase
MTNNHHDPAYKRFFSQPVMIKDLLVEYVGEDWVKELDFSTLEKQNGSYAADDYRDRHDDLIWRVRWGKEWLYVYLLLEFQSDIDQFMAVRMMTYLGLLYQDLIAQGKLTSDGRLPPVLPVVLYNGQRRWSAATDIDSLIERIPGGLSAYRPQMRYMLLDEGALLSKDNSPELHSLVHALFRLEHSRTPDDMRSIVATLSKWLVKPEQRPIRREFAIWIQRVLLRRKPFADSKLFDWEEVQDLEEVNEMLAERMNEWEREWKQEGRLEGRQEGLLAGEGKSLLLLLEQKFGKEAAEQYRPRVEQADEPTIQQWLINILTANSIEEVFR
>NZ_AP017372.2|WP_162549280.1|337940_338105_-|hypothetical-protein
MAGEGKSLLLLLEQKFGKEAAEQYRPRVEQADEPTIQQWLINILTANSIEEVFR
>NZ_AP017372.2|WP_096407491.1|336969_337461_-|ammonia-forming-cytochrome-c-nitrite-reductase-subunit-c552
MTDLLDAKGDDFWGSNFHDYRKAIDQEEHTIGCTNCHDPDDKMRLTLTSVPLKEYLERQGKEWQEKSTQKMRSLVCAQCHSEYYFETEEHGTAGKVHFPWDNGKDPLDMYEFKSDGDPERDGFAGQFVDWTHAVSKAPMLKVQHPEYEMYQVSIAGDRFPASA
>NZ_AP017372.2|WP_096407488.1|336507_336900_+|hypothetical-protein
MTSRSATITAILVGFAIAISGCQALWPAGDAKPELGEQQEIHQTLNAMDPIEYGEYKLDIEFGSKGWIAEREGEYFMGGSLDTSDTSEGMTLTLQQTHQYNEQIGWVELDGRGTELVLEYQEDPQSLNLQ
>NZ_AP017372.2|WP_162549279.1|333660_335085_-|WD40-repeat-domain-containing-protein
MATLLGVAQGASSERRLWWITSTIVGVVALPLALGLYQLDQNRTEMDSGLWSEARELDSAESYADYLENCTTCEREGRAEEKLQAAQDDERLWSQARDSDSEESYADYLENCTTCERKERAEEKLQAAQDDERLWSQARDSDSGESYADYLENCTTCERKERAEEKLQAAQEASEKWVFEGHDLKVKDVTVADHTVYSGGEDGIIRAIDSDTGEEQRVFEGHNGTIHSLAVSGETVYSSDSRGIVRATYAGDSGHTIGAYGAEAGEELWVFDGHDGMVRGVATDGNTVYSAGASMPLGGDEDETVRAILEGVEYWVFEGHDREVRDVAVDDDTVYSASADGTVRAIDSSTGNEHWVFEGHGASPVLGVEADGDTVFSAGMDNTVRAIDADTGSEQWIFEGHSSGVRSVAASGDTVYSASGGRGGDNSVRAIDAHTGKEQWVFEAHEGTVNGVAVKGDTVYSASDDGTVRAITPP
>NZ_AP017372.2|WP_096407483.1|332551_333151_-|hypothetical-protein
MRKITFPLAALAAPLSLINLSSASASSLEGPYIGLGTAIATSYHYELEADVTTGLLNQSDTNTVELRSGHLGSMGSSFDILLGGGATTESIYYGFELFYSAGNSDEELLEADLESDDVEATATVEVQDGYGVSLRLGYLHTSRSMAYLKTVYTEREFEGTLDIRAGDNSESFSESGNSVDSELALVSSCSVRTCLCHFV
>NZ_AP017372.2|WP_096407481.1|331436_331919_-|RDD-family-protein
MSEAQNHQALTQESDKKLYGGFWIRVGAALIDMLVLLIPMLLLSYLLLVLIAPTTHEEELFYQGIDSVLAFAIWLVYTAGFHSSTWQATLGKRALGLKVTSLEGNRISFGHAAGRYVAEILNVLTLGIGYIMVGLTSRKQGLHDMVAGTYVVRTEDRGPF
>NZ_AP017372.2|WP_096407506.1|348458_349724_+|glucose-1-phosphate-adenylyltransferase
MQENASPRYVSRLTRNTLALILAGGRGTRLKHLTQWRAKPAVPFGGKFRIIDFPLSNCVNSGIRRIGVLTQYKAHSLIRHIRQGWSSLRADFSEFVELLPAQQRIETSWYLGTADAVYQSLDIVRMHNPELVLILAGDHVYKMDYGPLLAYHVEKGADVTVGCIEVPLDEASAFGLMNINEDNQVVRFEEKPADPTPMPGSQTHSLASMGIYVFNREFMFKALGVDARTSSEHDFGKDIIPSLIDKAQVYAYPFRDPATGDQSYWRDVGTVDAFWRANLELVEVTPELNLCDREWPIWTFQEQLPPAKFVFDEDQRRGMVVDSMVSGGCIVAGAYLRRSVLFSSVVVDERTKVQDSVILPEARIEPGCRISNAVIDKHCRIEAGTVIGEDPEEDARRFHVTDSGVVLVTPDMLGQEIHVVY
>NZ_AP017372.2|WP_096407509.1|349710_351477_+|glycoside-hydrolase
MLSIEKSSTTGPSPDKVRVVLCWHMHQPSYVNPASGDYELPWTYLHGIKDYTDMAAHLEANPQARAVVNFSPILIEQIEDYAEQIKGFLASGERLRDPLLNALAQPVISADPEHRRSILEQCRRINRPRLVDPYPQYRQLMEFADLLDQQPTMLRYLDESFHEDLVTWYHLAWLGETVRGSEPLAKRLIEKGHGYSVHERRELLALIGEQLSGLLPRYRKLAEQGRVELSMTPYGHPILPLLQDLQSALEAWPDAPMPEQVTAYPGGEERARWHLEHGREVFERAFGQAPHGCWPSEGALSEPTVRLLSECGFKWAASGSGVLENSLNGNGVEEQQRNGHWHRAYIFQGEASGAGENSVEPTRCFFRDDGLSDAIGFVYSDWHGDDAVANLVVKLEEIAVASKDPGNTVISIIMDGENAWEHYPANGYYFLSGLYEKLSEHPRLHLTTFAEAIEQVEPIALDRLVAGSWVYGTLSTWIGEVDKNRAWELLVAAKQAYDSQIDKLEGPARDRAERQLAICESSDWFWWFGDYNPPDVVRDFDHLFRIQLAALYQCLGLEPPQELDHRFTHIGTGSPQMGGVMRQGRLES
>NZ_AP017372.2|WP_096407511.1|351473_353033_+|4-alpha-glucanotransferase
MSGRGLTEQRRAGVLAHLSSLPGGPGNGDLGAHSRYFVDWLANCGFSVWQMLPLGPTHEDLCPYQCLSVHAADPGFIDLQQLVEAGYLSAEQAIPPTDLSRSELLNWRYQRLRDARAGFVARHGQNGKGQAQGEEGQAPPPPPPPETNSELRELRQFRACHSHWLEDYALYMALRRENEFRPWWEWPQPLRDRQPQALEEARERLGEELNQVVFEQFIFFRQWAALRAYAAEKGVLLFGDMPIFVAHDSAEVWAQREYFDLGADGQPLSVAGVPPDYFAADGQRWGNPHYNWQRMAEDGFKWWLQRLETQLELFDFVRLDHFRGLAAYWSIPVEAETARDGHWEPAPGHDLLSAVAQRFGQIPLVAEDLGIITDDVVALREQFALPGMKVLQFAFDSDSANPYLPHNHTADSVVYTGTHDNDTTMGWYADLEPWVTERMHSYLGHPNEPMPWPLVRASLASVSGLAILPLQDLLALGSDHRMNIPGVAEGNWRWRFEWEWLPDDLSGWLWELNYLYGRV
>NZ_AP017372.2|WP_096407514.1|353393_355943_-|alpha-glucan-family-phosphorylase
MKENIFTLEVQPNIPPNLSRLEELAEDLYYSWDRHVRALFVQLDPELWEACGHNPKVFLRRIAQHKLEEAAQDEAYIADYNRTLSAYDTYHEQAALTSKVAPYIDPDNDLVAYFCAEFGFHESVPLYSGGLGILAGDHCKAASDLRLPLVAVGLLYRQGYFSQTIDHEGNQQAHYAPSSISELPITPCLDDDGEQVQVSVDAPGREIHLRVWQMRAGHVLIYLLDSEVPENDAADRAITYQLYGGDAHMRILQELCLGLGGVRALRKLGISPSVWHINEGHSAFQIVERCRELISEGYDSATAIEAVASETVFTTHTPVPAGHDIFEPEMVAEHLAPNLADTDIPIEDILALGNGQKGFDMTSLALRGSRFHNGVSAIHGGVASQMEQHIWPEIPAQENPITSITNGIHVPTFLAQEWANLFDQRWHAWRNQLLNEDFWKVVDELPDHRFWSMRRSLKSELLRDVYQRVLKRCQRNGMSDAMIERMTSNISNPDPDLLVIGFARRFATYKRALLIFYEIDRLKELLNDPQRPVILIFAGKAHPHDEKGQAMIRRIHELSLDPDLIGKIILLEDYDMAQARKLVTGVDVWLNNPEYPLEACGTSGQKAAINGVLNLSVLDGWWDEGYEKGNGWAILPHSAGFDPEYRDREEARDLLNLLSDEVIPLYFNRGNSGYATEWVKMSKAAMRTTLPRFNAQRMVMDYVSELYAPARAQSKILQADSLSGAQELARWKERVREHWGGTWLERIDAAPTSLLHGESLPIRVKAHLNGLSCDDVTIECRFSAMEEPRDAASTVRYQLQPEGETEDGMPVFAIDIEPRFDGLQYYRICMYPTHPLASHPFEFGGLRWL
>NZ_AP017372.2|WP_096407516.1|356933_357164_-|Rpn-family-recombination-promoting-nuclease/putative-transposase
MADHPANPRDALLKATLETPERAAVVLRESLPDKVRERLSDDLPTPLPGSYVDPSPQETHSDRLFEAQMMASQPGL
>NZ_AP017372.2|WP_096407519.1|357185_357506_-|hypothetical-protein
MRQNTALKILNSQADEGRAVFTRRDLDSLFRSDRTKARKAGIARLVEAGWLKPAARGGGVYVYPPGLPQDGYTPERIARALRRGEYNYISLESALSEWGALTRNRQ
>NZ_AP017372.2|WP_096407521.1|358004_358421_-|PIN-domain-containing-protein
MRVFLDASAIIYLLEGDGQTRDATRQVLLELERGSDETPVLMASALSRLECRVRPLRESDTQALERLDGFFDDPGLSVIALDTAVLDRATELRAQYRLRTPDAIQAACLLTVDPRGAFVTGDGDFEKVPGLHVYRIPH
>NZ_AP017372.2|WP_096410287.1|358420_358696_-|type-II-toxin-antitoxin-system-Phd/YefM-family-antitoxin
MENVISAQEIKRRGISAVDQALKNGPVHVIQRNRPRYVILSEESYQRLSEGAQARKRLWDRLLGDDEAYGAARNRAELDRELQSEREGWRD
>NZ_AP017372.2|WP_096407525.1|359166_359364_+|DUF2283-domain-containing-protein
MKLQYFEDTDTLYIEFQSRAISETRDLDENTILDLDSEGNVCAITFEHASQRTDVNHLHVEGLAA
>NZ_AP017372.2|WP_162549282.1|359702_360023_-|hypothetical-protein
MYSYIQEKDVRQALEQTRPDRAEELVMTVAEEWIKRGEKRGEKRGQKRGSHQTATKTLLRQIERKFGAEAKEASRARVERAALGELEMWLDRILDAERIEDVFAED

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_AP017372_3

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_AP017372_3

540570-540664

Orphan

Consensus_repeat	Method
TTCACGGCGTCCTCCACACCGGGG	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_AP017372_3

>merge|NZ_AP017372|3|540570-540664|CRISPRCasFinder
TTCACGGCGTCCTCCACACCGGGGCGGATGGTGGCGCCGGCGAAGTTTTAGAGGTTCCCTCCAGGAGTGGGTTCACGGCGTCTTCCACACCGGGG

>NZ_AP017372|3|2|540570-540664|CRISPRCasFinder
TTCACGGCGTCCTCCACACCGGGG	CGGATGGTGGCGCCGGCGAAGTTTTAGAGGTTCCCTCCAGGAGTGGG
TTCACGGCGTCTTCCACACCGGGG

Protein	Signature genes	Signature genes Name	Protein_function
NZ_AP017372.2\|WP_179948771.1\|542204_542891_-\|Bax-inhibitor-1/YccA-family-protein	unknown	unknown	gnl\|CDD\|198415
NZ_AP017372.2\|WP_096407976.1\|548873_551336_+\|endopeptidase-La	unknown	unknown	gnl\|CDD\|223542
NZ_AP017372.2\|WP_096407944.1\|534522_534975_+\|50S-ribosomal-protein-L9	unknown	unknown	gnl\|CDD\|234659
NZ_AP017372.2\|WP_096407941.1\|533562_534447_+\|hypothetical-protein	unknown	unknown	unknown
NZ_AP017372.2\|WP_096407968.1\|543860_545045_-\|hypothetical-protein	unknown	unknown	unknown
NZ_AP017372.2\|WP_096407938.1\|533325_533550_+\|30S-ribosomal-protein-S18	unknown	unknown	gnl\|CDD\|178997
NZ_AP017372.2\|WP_096407936.1\|532883_533243_+\|30S-ribosomal-protein-S6	unknown	unknown	gnl\|CDD\|179034
NZ_AP017372.2\|WP_096407973.1\|547454_548738_+\|ATP-dependent-Clp-protease-ATP-binding-subunit-ClpX	unknown	unknown	gnl\|CDD\|235422
NZ_AP017372.2\|WP_096407955.1\|539069_539450_-\|PilZ-domain-containing-protein	unknown	unknown	gnl\|CDD\|377796
NZ_AP017372.2\|WP_096407970.1\|546695_547340_+\|ATP-dependent-Clp-endopeptidase-proteolytic-subunit-ClpP	unknown	unknown	gnl\|CDD\|178955
NZ_AP017372.2\|WP_096407933.1\|531719_532502_+\|23S-rRNA-(guanosine(2251)-2'-O)-methyltransferase-RlmB	unknown	unknown	gnl\|CDD\|183021
NZ_AP017372.2\|WP_096407957.1\|539517_540375_-\|bifunctional-methylenetetrahydrofolate-dehydrogenase/methenyltetrahydrofolate-cyclohydrolase-FolD	unknown	unknown	gnl\|CDD\|236760
NZ_AP017372.2\|WP_096410302.1\|545377_546673_+\|trigger-factor	unknown	unknown	gnl\|CDD\|234956
NZ_AP017372.2\|WP_096407963.1\|543036_543231_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|235668
NZ_AP017372.2\|WP_096407946.1\|535154_536540_+\|replicative-DNA-helicase	unknown	unknown	gnl\|CDD\|273206
NZ_AP017372.2\|WP_096407951.1\|537644_539030_+\|DNA-repair-protein-RadA	unknown	unknown	gnl\|CDD\|236994
NZ_AP017372.2\|WP_096407978.1\|551639_551912_+\|HU-family-DNA-binding-protein	unknown	unknown	gnl\|CDD\|259853
NZ_AP017372.2\|WP_096407949.1\|536536_537634_+\|alanine-racemase	unknown	unknown	gnl\|CDD\|143500
NZ_AP017372.2\|WP_096407965.1\|543357_543828_-\|flagellar-basal-body-associated-FliL-family-protein	unknown	unknown	gnl\|CDD\|377123
NZ_AP017372.2\|WP_162549320.1\|541344_542148_+\|phosphodiesterase	unknown	unknown	gnl\|CDD\|277347

Protein	Function_ID	Function_description	E-value
NZ_AP017372.2\|WP_096407976.1\|548873_551336_+\|endopeptidase-La	gnl\|CDD\|223542	COG0466, Lon, ATP-dependent Lon protease, bacterial type [Posttranslational modification, protein turnover, chaperones].	0
NZ_AP017372.2\|WP_096407944.1\|534522_534975_+\|50S-ribosomal-protein-L9	gnl\|CDD\|234659	PRK00137, rplI, 50S ribosomal protein L9; Reviewed.	3.11348e-64
NZ_AP017372.2\|WP_096410302.1\|545377_546673_+\|trigger-factor	gnl\|CDD\|234956	PRK01490, tig, trigger factor; Provisional.	2.54467e-158
NZ_AP017372.2\|WP_096407978.1\|551639_551912_+\|HU-family-DNA-binding-protein	gnl\|CDD\|259853	cd13831, HU, histone-like DNA-binding protein HU. This subfamily includes HU and HU-like domains. HU is a conserved nucleoid-associated protein (NAP) which binds non-specifically to duplex DNA with a particular preference for targeting nicked and bent DNA. It is highly basic and contributes to chromosomal compaction and maintenance of negative supercoiling, thus often referred to as histone-like protein. HU can induce DNA bends, condense DNA in a fiber and also interact with single stranded DNA. It contains two homologous subunits, alpha and beta, typically forming homodimers (alpha-alpha and beta-beta), except in E. coli and other enterobacteria, which form heterodimers (alpha-beta). In E. coli, HU binds uniformly to the chromosome, with a preference for damaged or distorted DNA structures and can introduce negative supercoils into closed circular DNA in the presence of topoisomerase I. Anabaena HU (AHU) shows preference for A/T-rich region in the center of its DNA binding site.	2.44588e-50
NZ_AP017372.2\|WP_096407938.1\|533325_533550_+\|30S-ribosomal-protein-S18	gnl\|CDD\|178997	PRK00391, rpsR, 30S ribosomal protein S18; Reviewed.	6.03802e-38
NZ_AP017372.2\|WP_179948771.1\|542204_542891_-\|Bax-inhibitor-1/YccA-family-protein	gnl\|CDD\|198415	cd10433, YccA_like, YccA-like proteins. A prokaryotic member of the BAX inhibitor (BI)-1 like family of small transmembrane proteins, Escherichia coli YccA, has been shown to interact with ATP-dependent protease FtsH, which degrades abnormal membrane proteins as part of a quality control mechanism to keep the integrity of biological membranes.	2.12638e-84
NZ_AP017372.2\|WP_096407973.1\|547454_548738_+\|ATP-dependent-Clp-protease-ATP-binding-subunit-ClpX	gnl\|CDD\|235422	PRK05342, clpX, ATP-dependent Clp protease ATP-binding subunit ClpX.	0
NZ_AP017372.2\|WP_096407955.1\|539069_539450_-\|PilZ-domain-containing-protein	gnl\|CDD\|377796	pfam07238, PilZ, PilZ domain. PilZ is a c-di-GMP binding domain which is found C terminal to pfam07317. Proteins which contain PilZ are known to interact with the flagellar switch-complex proteins FliG and FliM. This interaction results in a reduction of torque generation and induces CCW motor bias. This domain forms a beta barrel structure.	6.48903e-10
NZ_AP017372.2\|WP_096407970.1\|546695_547340_+\|ATP-dependent-Clp-endopeptidase-proteolytic-subunit-ClpP	gnl\|CDD\|178955	PRK00277, clpP, ATP-dependent Clp protease proteolytic subunit; Reviewed.	1.74391e-151
NZ_AP017372.2\|WP_096407933.1\|531719_532502_+\|23S-rRNA-(guanosine(2251)-2'-O)-methyltransferase-RlmB	gnl\|CDD\|183021	PRK11181, PRK11181, 23S rRNA (guanosine(2251)-2'-O)-methyltransferase RlmB.	1.01979e-90
NZ_AP017372.2\|WP_096407957.1\|539517_540375_-\|bifunctional-methylenetetrahydrofolate-dehydrogenase/methenyltetrahydrofolate-cyclohydrolase-FolD	gnl\|CDD\|236760	PRK10792, PRK10792, bifunctional methylenetetrahydrofolate dehydrogenase/methenyltetrahydrofolate cyclohydrolase FolD.	0
NZ_AP017372.2\|WP_096407963.1\|543036_543231_-\|hypothetical-protein	gnl\|CDD\|235668	PRK06007, fliF, flagellar basal body M-ring protein FliF.	1.81327e-05
NZ_AP017372.2\|WP_096407946.1\|535154_536540_+\|replicative-DNA-helicase	gnl\|CDD\|273206	TIGR00665, DnaB, replicative DNA helicase. This model describes the helicase DnaB, a homohexameric protein required for DNA replication. The homohexamer can form a ring around a single strand of DNA near a replication fork. An intein of > 400 residues is found at a conserved location in DnaB of Synechocystis PCC6803, Rhodothermus marinus (both experimentally confirmed), and Mycobacterium tuberculosis. The intein removes itself by a self-splicing reaction. The seed alignment contains inteins so that the model built from the seed alignment will model a low cost at common intein insertion sites. [DNA metabolism, DNA replication, recombination, and repair].	0
NZ_AP017372.2\|WP_096407936.1\|532883_533243_+\|30S-ribosomal-protein-S6	gnl\|CDD\|179034	PRK00453, rpsF, 30S ribosomal protein S6; Reviewed.	2.68473e-49
NZ_AP017372.2\|WP_096407951.1\|537644_539030_+\|DNA-repair-protein-RadA	gnl\|CDD\|236994	PRK11823, PRK11823, DNA repair protein RadA; Provisional.	0
NZ_AP017372.2\|WP_096407949.1\|536536_537634_+\|alanine-racemase	gnl\|CDD\|143500	cd06827, PLPDE_III_AR_proteobact, Type III Pyridoxal 5-phosphate (PLP)-Dependent Enzymes, Proteobacterial Alanine Racemases. This subfamily is composed mainly of proteobacterial alanine racemases (EC 5.1.1.1), fold type III PLP-dependent enzymes that catalyze the interconversion between L- and D-alanine, which is an essential component of the peptidoglycan layer of bacterial cell walls. hese proteins are similar to other bacterial ARs and are fold type III PLP-dependent enzymes containing contains an N-terminal PLP-binding TIM-barrel domain and a C-terminal beta-sandwich domain. They exist as homodimers with active sites that lie at the interface between the TIM barrel domain of one subunit and the beta-sandwich domain of the other subunit. Homodimer formation and the presence of the PLP cofactor are required for catalytic activity.	0
NZ_AP017372.2\|WP_096407965.1\|543357_543828_-\|flagellar-basal-body-associated-FliL-family-protein	gnl\|CDD\|377123	pfam03748, FliL, Flagellar basal body-associated protein FliL. This FliL protein controls the rotational direction of the flagella during chemotaxis. FliL is a cytoplasmic membrane protein associated with the basal body.	5.83861e-28
NZ_AP017372.2\|WP_162549320.1\|541344_542148_+\|phosphodiesterase	gnl\|CDD\|277347	cd07402, MPP_GpdQ, Enterobacter aerogenes GpdQ and related proteins, metallophosphatase domain. GpdQ (glycerophosphodiesterase Q, also known as Rv0805 in Mycobacterium tuberculosis) is a binuclear metallophosphoesterase from Enterobacter aerogenes that catalyzes the hydrolysis of mono-, di-, and triester substrates, including some organophosphate pesticides and products of the degradation of nerve agents. The GpdQ homolog, Rv0805, has 2',3'-cyclic nucleotide phosphodiesterase activity. GpdQ and Rv0805 belong to the metallophosphatase (MPP) superfamily. MPPs are functionally diverse, but all share a conserved domain with an active site consisting of two metal ions (usually manganese, iron, or zinc) coordinated with octahedral geometry by a cage of histidine, aspartate, and asparagine residues. The MPP superfamily includes: Mre11/SbcD-like exonucleases, Dbr1-like RNA lariat debranching enzymes, YfcE-like phosphodiesterases, purple acid phosphatases (PAPs), YbbF-like UDP-2,3-diacylglucosamine hydrolases, and acid sphingomyelinases (ASMases). The conserved domain is a double beta-sheet sandwich with a di-metal active site made up of residues located at the C-terminal side of the sheets. This domain is thought to allow for productive metal coordination.	5.70705e-69

>NZ_AP017372.2|WP_096407957.1|539517_540375_-|bifunctional-methylenetetrahydrofolate-dehydrogenase/methenyltetrahydrofolate-cyclohydrolase-FolD
MPAQILDGKAIAAERRSMVARSVDERSAQGKRPPGLAVILVGSDPASAVYVRNKRRACDEAGLLSRSYDLPAETSEAELLQQIDQLNADEQIDGILVQLPLPGHINAQTVIERIDPQKDVDGFHPENMGRLITRLPGLRPCTPHGVMTLLEHTGVDLAGLDAVVIGQSNIVGRPMALELLNARCTITICHSRTKDLAARVNAADLVVASVGSPGLVRGDWIARGAIVIDVGINRRADGKLTGDVDFDEACEKASWITPVPGGVGPMTVATLLENTLEAAKLREQI
>NZ_AP017372.2|WP_096407955.1|539069_539450_-|PilZ-domain-containing-protein
MSANERRHFSRVEFQAPAQLATQAGSVHDVEILDISMRGALVRLSSGTLPPIELCSEGNRFTLKISLSEIDTIEMEVEAAHCHEHEIGLRCVRIDLDSIMHLRSLIEANLGDPDLVNRELANLIED
>NZ_AP017372.2|WP_096407951.1|537644_539030_+|DNA-repair-protein-RadA
MSRRTRPHYVCQDCGASQPQWVGQCPECGEWNTLEEHIEPARNVAANPVTAARSPGLAASAGEVSALAEVSTAPEPRLSTSVDELDRVLGGGLVPGSVVLIGGDPGIGKSTLLLQTLAALSRHYPSLYATGEESLQQVALRARRLGVADAPLQLMAETSVETILATAQQLRPEALVIDSIQTVHSAALSSAPGSVSQVRDSAAQLVRWAKETGTALILVGHVTKEGAIAGPRVLEHMVDTVLYFESDQGSRYRLLRAVKNRFGAANELGLFAMTEDGLRQVRNPSAIFLSRHECAVSGSAIVVSREGSRPLLLEVQALVADSSLAQPRRVAVGIEQSRLSLLLAVLQRHGGVVTAGEDVFINVVGGVRIHETAGDLPVLAAVLSSMRNRPLPMNSVLFGELGLAGEVRPVPGGEERLAEAAKHGFTLAVVPEKNAPRKGIKGMEIHPVRRLEQAFEVLFSN
>NZ_AP017372.2|WP_096407949.1|536536_537634_+|alanine-racemase
MSREACALIDLDAVRDNLRVARAVAARSRVMAVIKSDGYGHGLVRVAQAIGEDVDAFAVTDLDEALALRRAGFNQRIVLLQGPFEAAEIPLAAAEQLELVIHSAWQIEAIEQAQVSAALQLWLKVDTGMHRLGFQADEVAAAWRRLTAIPAHTVNPEIGFMTHLACADDRDDTMTDRQIEAFEEACKDFGGPLSAANSAGLLGWLESHFDWVRPGIMLYGVSPFSDRQPLDFPLRPAMTLRGRIIAVKHLGAGQKVGYGATWSCPEDMPIGIVSIGYGDGYPRHAMHGTPVDVAGRRASLVGRISMDMLAVDLRGMVTLPAPGDPVTLWGEQPRPESVADSAGTIAYELFCRTPSRVRRVYLDDQ
>NZ_AP017372.2|WP_096407946.1|535154_536540_+|replicative-DNA-helicase
MQHDGAATNAESLKVPPHDLEAEQAVLGGLMLDNSAWDQIADRLHEEDFYRREHRLVYRAMAELADGGQPMDVVTLSGRLRQQGRLDDAGGLQYLGGISRETPSAANIRAYADIVRERSVLRQLIRAGSDVAAAAFEPQGRDSETLLDYAEQTIFAIAEQTGRHRQGFVGMRELMPQVIDRIDALYRTQEAVTGLPTGFDDLDHLTSGLQNGDLVIVAGRPSMGKTTFAMNIVEHVVMHRKLPVAVFSMEMPAEALAMRMLASLGRVHLQRVRSGRLQDDDWPRLTSTMSLLAEAPLFVDDSPGLSPTDVRARSRRLQREHDGLGLIVVDYLQLMQSSGLRENRAGELSEISRGLKALAKELNAPVIALSQLNRSLEQRPNKRPIMSDLRESGAIEQDADLIAFIYRDEVYHEDSPDKGVAELIIGKQRQGPIGTVRLTFLGEYTRFENFAEDIYGGGIPG
>NZ_AP017372.2|WP_096407944.1|534522_534975_+|50S-ribosomal-protein-L9
MELILLEKVANLGDLGDRVRVRPGFGRNYLLPYGKAKPATAENIRYFEERRAELEKQAREALEAAQSRLEKLQATPLTIKAKSGEQGKLFGSVAPGDIAAAAEQAGVELAKREVRMPDGPIRVTGEYDVQVQLHTDVVGAVRVVVEGQEP
>NZ_AP017372.2|WP_096407941.1|533562_534447_+|hypothetical-protein
MKAFAAFILRGPFQAATVMIAASLLPFLAVIAMGVLSLVTLRQGLQQGLFAAALAGGMLAALLWAMAGTYEPALRIVIEQWLPVLVLAEVLRRTVSLPLTLFVWAGLGALTVAGFHVVVDDPMAHWLAVTEQFLAATGAEQLPEETEAFLREDLLPIMTGLWVVNLMSVVLIGLLLGRWVQAIMFNPGGLREEFYRLDLGRSAAFVALVVLLAAVFSGPGPIYDLALVLAAAFIVQALAATHALMGKRNWSAAWLVPVYLVIPFLYMPMALLGIGEALFQWRRRLLGDGSGGAA
>NZ_AP017372.2|WP_096407938.1|533325_533550_+|30S-ribosomal-protein-S18
MGRFFRRRKYCKFTAEGVKEIDYKDLNTLKNYITDTGKIVPSRITGTNARYQRQLSRAIKRARYLALLPYTDRH
>NZ_AP017372.2|WP_096407936.1|532883_533243_+|30S-ribosomal-protein-S6
MRHYEIVFMVHPDQSDQVPAMLERYRSIVESNGGTIHRLEDWGRRQLAYPINKLIKAHYVLMNVECGQEELDELTSAFRFNDAVIRNMVLARDEAVTEPSPLLKGGEKREERRDYAEEE
>NZ_AP017372.2|WP_096407933.1|531719_532502_+|23S-rRNA-(guanosine(2251)-2'-O)-methyltransferase-RlmB
MANRLGSEAEERAKSHSLIYGRHPVREAATYDPAGVVAIWVDQALRRDPKLERLFNKLKKQGVTFYRVKRRELDEMVGGANHQGVVLSYRGAAVRGEAELNDLLDSARDPLLLVLDRVQDPHNLGACLRSAAAAGAAGVVAPRDHAASLSPAVHKVAAGAVQSVPFFQVTNLARALANMQQAGLVTIGAAGDGAQTLYSLELRGAIALVMGGESEGLRRLTRKNCDYVAAIPMPGSIESLNVAVAAGVVLFEAVRQRSNC
>NZ_AP017372.2|WP_162549320.1|541344_542148_+|phosphodiesterase
MLCPDEPLRVLHISDLHLGDDPQWSYQGVRPWERLTEALIGVDPDCLGAQGLSRAPFDLVVVTGDLAHDQGESVYAKLSEQLAALKVPVLVLPGNHDDPEGFQRIFTDSGQVSYCREYFAGGWRILCLNSQVPGQITGRLGGQQLNALEQDLQQNQDLPTLIALHHAPVEVGTPWLDVQRLEDGESFLELVERYPQVRGVVFGHVHQDFAERRQSGLRLLAAPAVSIQFEPGSAVFAVEPSPPGVRWLELCSNGSLQSEVWWLEGCD
>NZ_AP017372.2|WP_179948771.1|542204_542891_-|Bax-inhibitor-1/YccA-family-protein
MSEQYSNSRAATATGREQAQQQALATNRLIRNTYILLAITLAFSAVTAGIAVLTDAPRLNIFVVLGGFFGLLFLTQYLRNSAWGLASIFALTGFMGYTLGPVINLYLGLPNGGETVMMAFGGTAAIFLGLSGYALASRRDFSFMRGFLFAGILVAFVAAIAAYFLQMPGLSLAVSVMFMILMSGLILYQTSEMVNGGETNYIMATITLYIAIYNLFTSLLHLLGLAND
>NZ_AP017372.2|WP_096407963.1|543036_543231_-|hypothetical-protein
MADEESPSTQQHGSLLSSSHNRHNSYEHKIEAIRDLIEDDPERAVAVIKLWLEGTQNSGKEEKS
>NZ_AP017372.2|WP_096407965.1|543357_543828_-|flagellar-basal-body-associated-FliL-family-protein
MPKSIYVLLTAATVLLTITLGFVLAIATGWITPPGMQQYDSDPASTEVDYDDAQYVELEPSLTVNFGDGERLRYLEADVQVQTSQDEVVEALERHSAAIRDELIMLFSEQSPEDLNDVEGREELRNRSEEIINGILEKRGVEGRIDDVFFTEFVMQ
>NZ_AP017372.2|WP_096407968.1|543860_545045_-|hypothetical-protein
MTLFAIVVLILLLALREVCSNRIRRLSHAQPHSTRRWRIARSWHTFALGLAAAAFLPTFVQQPELPILSEAHSLLSHTWPLFLIASGASVGLAIRIVNPQIKREIRRRQASIERRNRAQYGMNPERLSRGLRMWILDHGPAFDYRFDVETPDGVGNIVIGAEEGNFMIYVLPAEHAREGYATALQRSSKIAEHLDARGIVWIPDDKIKKAQTGDEHLAFVMRGSIVEVFRWIERTNEARRRNRERQEQRRNRALRSAQGEGIQWGSITEAEAMKKHDREAWERFARKTPIHPDMRDRVYRRHGARCAYCGFTMDPGRGQWEVIVSDYDHICRYPAKTRLVPYGIKPATSYEMPDCEQCHIEAPGHFEACISRLAPIHTRCKRERQEGKQDTAAD
>NZ_AP017372.2|WP_096410302.1|545377_546673_+|trigger-factor
MQVSIETTEGLGRRMTVQVPAERVEQEIERRLKDMAGRMKMDGFRPGKVPVKMVRKQYGEHVRQEVVNELLRQTYSDALKEQDLRPAGAPQVTPKQDESGQDLIYEASFEVLPQIEITGIEQIKVERPQVEVTDADVDNVLDRLRQQHADYEEVDRPAAQGDRVEIDFHGTVDGEEFQGNKAEDAAIIIGAGQLPEDFEQALVGAAAGTELTVEHTFPQGGDSPVAGKTAAFQVSVKRVEQANLPELDDAFAARLGVESGLNDLRDAVRANLENERDQAVRQRVKRQVMDQLAELNPVELPKSLIDGEIQALREQSGGASEGGMPETERDAYEEIARRRVQLGLLVNELVRSQQIQLDKERMMRELRQMAAQSGQDPNEALQQYAQNRRMMESLEASIIEEQAVDWLLEQVQTEERGMSFDELLNRDGNVS
>NZ_AP017372.2|WP_096407970.1|546695_547340_+|ATP-dependent-Clp-endopeptidase-proteolytic-subunit-ClpP
MSVEQHSSAPDIYNTGLVPMVVEQSPRGERAYDIFSRLLKERVIFLVGPVEDYQANLLVAQLLFLESENPDKDVHLYINSPGGSVTAGLAIYDTMQFIKPDVATLCVGQAASMGALLLAAGAEGKRYALPNSRMMIHQPLGGFQGQATDIDIHAREILSMRERLNAILSRHTGQDIETIRNDTDRDNFMTAEAAANYGLVDKVLESRTSSGKPA
>NZ_AP017372.2|WP_096407973.1|547454_548738_+|ATP-dependent-Clp-protease-ATP-binding-subunit-ClpX
MSDRKQGKGEDSGKLLYCSFCGKSQHEVRKLIAGPSVFICDECVDLCNDIIREELQESAEAEGEGLPKPHEINRALDEYVVGQEHAKKVLSVAVYNHYKRLEGHVDRDEVELTKSNILLIGPTGSGKTLLAETMARLLNVPFTIADATTLTEAGYVGEDVENIIQKLLQKCDYDVEKAQHGIVYIDEIDKVSRKADNPSITRDVSGEGVQQALLKLIEGTTASVPPQGGRKHPQQEFVQVDTTNILFVCGGAFAGLDKVIRERSEKGGIGFSAEIKGEKERASVGDTLRTVEPSDLVNYGLIPEFVGRLPVVATLDELDEEALVEILKEPKNALVKQYRKLFEMEGVELDLRDDALRAVANKAMERKTGARGLRTIIEQVLLETMYELPSMDNVSKVVVDESVIKGENQPYIVYATPECTKAASSDE
>NZ_AP017372.2|WP_096407976.1|548873_551336_+|endopeptidase-La
MVSKAQSPQQTQSENHTQAQAPLLPLRDVVVYPHMVIPLFVGRERSINALESAMESDKRIFLVAQRNAEVDEPAGGDLYSYGTVATILQMLKLPDGTVKVLVEGGERAQLVELLESDDYLAAKLSAVAEPESDPEDRELEVLARSAMSHFEQYVKLNKKIPPEILSSLAGIEEPGRLADTIAAHMALKVEEKQAILEMEKPSQRLEHLMGLIESEIDVLQLEKRIRGRVKQQMEKSQREYYLNEQMKAIQKELGELEDVPNEVEELERKIEESGMPQQALDKSRQELNKLKMMSPMSAEATVVRNYLDWIVSLPWKEKSRVRLDMKRAQKVLDEDHYGLDKVKERILEYLAVQRRVRKLKGPILCLVGPPGVGKTSLGQSIARATNRKFSRMSLGGVRDEAEIRGHRRTYIGSLPGKIVQNLSKVGKRNPLFLLDEVDKMAMDFRGDPASALLEVLDPEQNYSFNDHYLEVDFDLSDVMFVCTANTMNIPEPLLDRMEVIRLPGYTEQEKVAITKRHLLPKQMKANGLRKGELDLKDSAMRDIIRHYTREAGVRNLEREVATICRKVVKGLVEDEAKKRQSKGVQVTSRNLDKYLGVRRYRYGRAESEDRVGLATGLAWTEVGGELLTIEVAVVPGKGKATHTGQLGEVMKESIDAAMTVVRSRARTLGIQPEFYAQHDYHIHVPEGAIPKDGPSAGIGMCVALVSSLTGIPVRASVGMTGEITLRGEVLPIGGLKEKLLAALRGGIETVLIPAENEKDLADVPKEVKSKLDIRCVRWIDEVFDVALLQRPEPLAEESVSDEDETSQRSKVSENGSVRPH
>NZ_AP017372.2|WP_096407978.1|551639_551912_+|HU-family-DNA-binding-protein
MNKSELIEAVADSADLSKAAASRAVDAMVESITDALKEGDQVTLVGFGTFSVRERAARTGRNPQTGETIEIPASKVPGFKPGKALKDAVN

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_AP017372_4

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_AP017372_4

760082-760660

TypeI-E

I-E

Consensus_repeat	Method
GCGTTCCCCGCGCCTGCGGGGATGAACCG	CRISPRCasFinder
GCGTTCCCCGCGCCTGCGGGGATGAACCG	CRT
GCGTTCCCCGCGCCTGCGGGGATGAACCG	PILER-CR

9 spacers

cas2,cas1,cas6e,cas5,cas7,cse2gr11,cas8e,cas3,c2c9_V-U4

The CRISPR arrays of NZ_AP017372_4

>merge|NZ_AP017372|4|760082-760660|CRISPRCasFinder,CRT,PILER-CR
GCGTTCCCCGCGCCTGCGGGGATGAACCGCAGCGACAATTAACCGGCATTCCTGGCAAAATGCGTTCCCCGCGCCTGCGGGGATGAACCGCTCCGACGCTGCTCTCCTCAGCTTCGGCTTGGGCGTTCCCCGCGCCTGCGGGGATGAACCGGTAAGTACCCCGACGCGGAGCCGTCGCACTACGCGTTCCCCGCGCCTGCGGGGATGAACCGCGCGCTAATGCACTGCTGGATTTGCAAACTGAGCGTTCCCCGCGCCTGCGGGGATGAACCGGAGCTTAGACGATGTGATGCGCGCTAATGCGCGCGTTCCCCGCGCCTGCGGGGATGAACCGCGCGTCTTTAGCCGCCGCCTCTGCGCCTTCTTGCGTTCCCCGCGCCTGCGGGGATGAACCGTCTCGGCTAACGTTTTCCTCATGCCTCGATCGGCGTTCCCCGCGCCTGCGGGGATGAACCGAGCGGCACGTTTACCATGCCCGAAGATGAAATGCGTTCCCCGCGCCTGCGGGGATGAACCGCAATCTTAGCACTGTCAAGATCGACGGACTGGGCGTTCCCCGCGCCTGCGGGGATGAACCGT

>NZ_AP017372|4|3|760082-760660|CRISPRCasFinder
GCGTTCCCCGCGCCTGCGGGGATGAACCG	CAGCGACAATTAACCGGCATTCCTGGCAAAAT
GCGTTCCCCGCGCCTGCGGGGATGAACCG	CTCCGACGCTGCTCTCCTCAGCTTCGGCTTGG
GCGTTCCCCGCGCCTGCGGGGATGAACCG	GTAAGTACCCCGACGCGGAGCCGTCGCACTAC
GCGTTCCCCGCGCCTGCGGGGATGAACCG	CGCGCTAATGCACTGCTGGATTTGCAAACTGA
GCGTTCCCCGCGCCTGCGGGGATGAACCG	GAGCTTAGACGATGTGATGCGCGCTAATGCGC
GCGTTCCCCGCGCCTGCGGGGATGAACCG	CGCGTCTTTAGCCGCCGCCTCTGCGCCTTCTT
GCGTTCCCCGCGCCTGCGGGGATGAACCG	TCTCGGCTAACGTTTTCCTCATGCCTCGATCG
GCGTTCCCCGCGCCTGCGGGGATGAACCG	AGCGGCACGTTTACCATGCCCGAAGATGAAAT
GCGTTCCCCGCGCCTGCGGGGATGAACCG	CAATCTTAGCACTGTCAAGATCGACGGACTGG
GCGTTCCCCGCGCCTGCGGGGATGAACCGT

>NZ_AP017372|4|1|760082-760659|CRT
GCGTTCCCCGCGCCTGCGGGGATGAACCG	CAGCGACAATTAACCGGCATTCCTGGCAAAAT
GCGTTCCCCGCGCCTGCGGGGATGAACCG	CTCCGACGCTGCTCTCCTCAGCTTCGGCTTGG
GCGTTCCCCGCGCCTGCGGGGATGAACCG	GTAAGTACCCCGACGCGGAGCCGTCGCACTAC
GCGTTCCCCGCGCCTGCGGGGATGAACCG	CGCGCTAATGCACTGCTGGATTTGCAAACTGA
GCGTTCCCCGCGCCTGCGGGGATGAACCG	GAGCTTAGACGATGTGATGCGCGCTAATGCGC
GCGTTCCCCGCGCCTGCGGGGATGAACCG	CGCGTCTTTAGCCGCCGCCTCTGCGCCTTCTT
GCGTTCCCCGCGCCTGCGGGGATGAACCG	TCTCGGCTAACGTTTTCCTCATGCCTCGATCG
GCGTTCCCCGCGCCTGCGGGGATGAACCG	AGCGGCACGTTTACCATGCCCGAAGATGAAAT
GCGTTCCCCGCGCCTGCGGGGATGAACCG	CAATCTTAGCACTGTCAAGATCGACGGACTGG
GCGTTCCCCGCGCCTGCGGGGATGAACCG

>NZ_AP017372|4|2|760143-760659|PILER-CR
GCGTTCCCCGCGCCTGCGGGGATGAACCG	CTCCGACGCTGCTCTCCTCAGCTTCGGCTTGG
GCGTTCCCCGCGCCTGCGGGGATGAACCG	GTAAGTACCCCGACGCGGAGCCGTCGCACTAC
GCGTTCCCCGCGCCTGCGGGGATGAACCG	CGCGCTAATGCACTGCTGGATTTGCAAACTGA
GCGTTCCCCGCGCCTGCGGGGATGAACCG	GAGCTTAGACGATGTGATGCGCGCTAATGCGC
GCGTTCCCCGCGCCTGCGGGGATGAACCG	CGCGTCTTTAGCCGCCGCCTCTGCGCCTTCTT
GCGTTCCCCGCGCCTGCGGGGATGAACCG	TCTCGGCTAACGTTTTCCTCATGCCTCGATCG
GCGTTCCCCGCGCCTGCGGGGATGAACCG	AGCGGCACGTTTACCATGCCCGAAGATGAAAT
GCGTTCCCCGCGCCTGCGGGGATGAACCG	CAATCTTAGCACTGTCAAGATCGACGGACTGG
GCGTTCCCCGCGCCTGCGGGGATGAACCG

Protein	Signature genes	Signature genes Name	Protein_function
NZ_AP017372.2\|WP_096408436.1\|770279_771059_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|369445
NZ_AP017372.2\|WP_096408403.1\|756247_757285_+\|type-I-E-CRISPR-associated-protein-Cas7/Cse4/CasC	cas7	pfam09344_cas7_CAS-I-E	gnl\|CDD\|378153
NZ_AP017372.2\|WP_096408400.1\|755613_756222_+\|type-I-E-CRISPR-associated-protein-Cse2/CasB	cse2gr11	cd09731_cse2gr11_CAS-I-E	gnl\|CDD\|187862
NZ_AP017372.2\|WP_096408393.1\|750180_750744_-\|nucleoside-deaminase	unknown	unknown	gnl\|CDD\|238612
NZ_AP017372.2\|WP_096408410.1\|758738_759665_+\|type-I-E-CRISPR-associated-endonuclease-Cas1	cas1	cd09719_cas1_CAS-I-E	gnl\|CDD\|274693
NZ_AP017372.2\|WP_096408390.1\|749927_750140_+\|hypothetical-protein	unknown	unknown	unknown
NZ_AP017372.2\|WP_162549345.1\|765234_765834_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|373239
NZ_AP017372.2\|WP_096408430.1\|769016_769352_+\|transposase	c2c9_V-U4	-	gnl\|CDD\|284650
NZ_AP017372.2\|WP_096408413.1\|759667_759967_+\|type-I-E-CRISPR-associated-endoribonuclease-Cas2	cas2	pfam09707_cas2_CAS-I-E	gnl\|CDD\|236930
NZ_AP017372.2\|WP_096408425.1\|766204_767125_+\|DUF1016-family-protein	unknown	unknown	gnl\|CDD\|235264
NZ_AP017372.2\|WP_096408433.1\|769400_769673_+\|HigA-family-addiction-module-antidote-protein	unknown	unknown	gnl\|CDD\|274228
NZ_AP017372.2\|WP_096408415.1\|763849_764542_+\|DUF4338-domain-containing-protein	unknown	unknown	gnl\|CDD\|372975
NZ_AP017372.2\|WP_096408398.1\|753976_755617_+\|type-I-E-CRISPR-associated-protein-Cse1/CasA	cas8e	pfam09481_cas8e_CAS-I-E	gnl\|CDD\|187860
NZ_AP017372.2\|WP_096408405.1\|757295_758033_+\|type-I-E-CRISPR-associated-protein-Cas5/CasD	cas5	cd09645_cas5_CAS-I-E	gnl\|CDD\|187886
NZ_AP017372.2\|WP_096410315.1\|767972_768938_+\|paraslipin	unknown	unknown	gnl\|CDD\|223407
NZ_AP017372.2\|WP_096408408.1\|758032_758734_+\|type-I-E-CRISPR-associated-protein-Cas6/Cse3/CasE	cas6e	cd09727_cas6e_CAS-I-E	gnl\|CDD\|187858
NZ_AP017372.2\|WP_096408428.1\|767487_767928_+\|NfeD-family-protein	unknown	unknown	gnl\|CDD\|224501
NZ_AP017372.2\|WP_096408418.1\|764624_765014_+\|type-II-toxin-antitoxin-system-VapC-family-toxin	unknown	unknown	gnl\|CDD\|350221
NZ_AP017372.2\|WP_096408438.1\|771076_771571_-\|SsrA-binding-protein-SmpB	unknown	unknown	gnl\|CDD\|235455
NZ_AP017372.2\|WP_096408395.1\|750875_753662_+\|CRISPR-associated-helicase/endonuclease-Cas3	cas3	COG1203_cas3_CAS-I	gnl\|CDD\|182031

Protein	Function_ID	Function_description	E-value
NZ_AP017372.2\|WP_096408403.1\|756247_757285_+\|type-I-E-CRISPR-associated-protein-Cas7/Cse4/CasC	gnl\|CDD\|378153	pfam09344, Cas_CT1975, CT1975-like protein. CRISPR is a term for Clustered, Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This family is represented by CT1975 of Chlorobium tepidum.	1.89345e-119
NZ_AP017372.2\|WP_096408400.1\|755613_756222_+\|type-I-E-CRISPR-associated-protein-Cse2/CasB	gnl\|CDD\|187862	cd09731, Cse2_I-E, CRISPR/Cas system-associated protein Cse2. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Small alpha-helical protein; also known as Cse2/CasB/YgcK family; specific gene for I-E subtype;.	3.0859e-23
NZ_AP017372.2\|WP_096408393.1\|750180_750744_-\|nucleoside-deaminase	gnl\|CDD\|238612	cd01285, nucleoside_deaminase, Nucleoside deaminases include adenosine, guanine and cytosine deaminases. These enzymes are Zn dependent and catalyze the deamination of nucleosides. The zinc ion in the active site plays a central role in the proposed catalytic mechanism, activating a water molecule to form a hydroxide ion that performs a nucleophilic attack on the substrate. The functional enzyme is a homodimer. Cytosine deaminase catalyzes the deamination of cytosine to uracil and ammonia and is a member of the pyrimidine salvage pathway. Cytosine deaminase is found in bacteria and fungi but is not present in mammals; for this reason, the enzyme is currently of interest for antimicrobial drug design and gene therapy applications against tumors. Some members of this family are tRNA-specific adenosine deaminases that generate inosine at the first position of their anticodon (position 34) of specific tRNAs; this modification is thought to enlarge the codon recognition capacity during protein synthesis. Other members of the family are guanine deaminases which deaminate guanine to xanthine as part of the utilization of guanine as a nitrogen source.	2.86166e-31
NZ_AP017372.2\|WP_096408410.1\|758738_759665_+\|type-I-E-CRISPR-associated-endonuclease-Cas1	gnl\|CDD\|274693	TIGR03638, cas1_ECOLI, CRISPR-associated endonuclease Cas1, subtype I-E/ECOLI. The CRISPR-associated protein Cas1 is virtually universal to CRISPR systems. CRISPR, an acronym for Clustered Regularly Interspaced Short Palindromic Repeats, is prokaryotic immunity system for foreign DNA, mostly from phage. CRISPR systems belong to different subtypes, distinguished by both nature of the repeats, the makeup of the cohort of associated Cas proteins, and by molecular phylogeny within the more universal Cas proteins such as this one. This model is of type EXCEPTION and provides more specific information than the EQUIVALOG model TIGR00287. It describes the Cas1 protein particular to the ECOLI subtype of CRISPR/Cas system.	2.98711e-150
NZ_AP017372.2\|WP_162549345.1\|765234_765834_-\|hypothetical-protein	gnl\|CDD\|373239	pfam14706, Tnp_DNA_bind, Transposase DNA-binding. This domain occurs at the C-terminus of transposases including E. coli tnpA. TnpA encodes a transposase and an inhibitor protein, the inhibitor only differs from the transposase by the absence of the N-terminal 55 amino acids, which includes most of this domain. This domain consists of alpha helices and turns, and functions as a DNA-binding domain.	2.95429e-18
NZ_AP017372.2\|WP_096408436.1\|770279_771059_-\|hypothetical-protein	gnl\|CDD\|369445	pfam07635, PSCyt1, Planctomycete cytochrome C. These proteins share a region of homology at their N-terminus that contains the C-{CPWHF}-{CPWR}-C-H-{CFYW} motif typical of cytochromes C, or CxxCH.	5.2208e-11
NZ_AP017372.2\|WP_096408430.1\|769016_769352_+\|transposase	gnl\|CDD\|284650	pfam07282, OrfB_Zn_ribbon, Putative transposase DNA-binding domain. This putative domain is found at the C-terminus of a large number of transposase proteins. This domain contains four conserved cysteines suggestive of a zinc binding domain. Given the need for transposases to bind DNA as well as the large number of DNA-binding zinc fingers we hypothesize this domain is DNA-binding.	2.59529e-13
NZ_AP017372.2\|WP_096408413.1\|759667_759967_+\|type-I-E-CRISPR-associated-endoribonuclease-Cas2	gnl\|CDD\|236930	PRK11558, PRK11558, putative ssRNA endonuclease; Provisional.	6.77901e-57
NZ_AP017372.2\|WP_096408425.1\|766204_767125_+\|DUF1016-family-protein	gnl\|CDD\|235264	PRK04247, PRK04247, endonuclease NucS.	9.04348e-07
NZ_AP017372.2\|WP_096408433.1\|769400_769673_+\|HigA-family-addiction-module-antidote-protein	gnl\|CDD\|274228	TIGR02607, Virulence-associated_protein_I, addiction module antidote protein, HigA family. Members of this family form a distinct clade within the larger family HTH_3 of helix-turn-helix proteins, described by pfam01381. Members of this clade are strictly bacterial and nearly always shorter than 110 amino acids. This family includes the characterized member HigA, without which the killer protein HigB cannot be cloned. The hig (host inhibition of growth) system is noted to be unusual in that killer protein is uncoded by the upstream member of the gene pair. [Regulatory functions, DNA interactions, Regulatory functions, Protein interactions, Mobile and extrachromosomal element functions, Other].	1.27475e-30
NZ_AP017372.2\|WP_096408415.1\|763849_764542_+\|DUF4338-domain-containing-protein	gnl\|CDD\|372975	pfam14236, DUF4338, Domain of unknown function (DUF4338). This family of proteins is functionally uncharacterized. This family of proteins is found in bacteria. Proteins in this family are typically between 206 and 475 amino acids in length.	4.42393e-70
NZ_AP017372.2\|WP_096408398.1\|753976_755617_+\|type-I-E-CRISPR-associated-protein-Cse1/CasA	gnl\|CDD\|187860	cd09729, Cse1_I-E, CRISPR/Cas system-associated protein Cse1. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Large proteins, some contain Zn-finger domain; subunit of the Cascade complex; signature gene for I-E subtype; also known as Cse1/CasA/YgcL family.	1.53843e-141
NZ_AP017372.2\|WP_096408405.1\|757295_758033_+\|type-I-E-CRISPR-associated-protein-Cas5/CasD	gnl\|CDD\|187886	cd09756, Cas5_I-E, CRISPR/Cas system-associated RAMP superfamily protein Cas5. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas5 is a RAMP superfamily protein; Subunit of the Cascade complex.	1.50536e-44
NZ_AP017372.2\|WP_096410315.1\|767972_768938_+\|paraslipin	gnl\|CDD\|223407	COG0330, HflC, Membrane protease subunits, stomatin/prohibitin homologs [Posttranslational modification, protein turnover, chaperones].	1.90312e-59
NZ_AP017372.2\|WP_096408408.1\|758032_758734_+\|type-I-E-CRISPR-associated-protein-Cas6/Cse3/CasE	gnl\|CDD\|187858	cd09727, Cas6_I-E, CRISPR/Cas system-associated RAMP superfamily protein Cas6e. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas6e is an endoribonuclease that generates crRNA; This family is specific for CRISPR/Cas system I-E subtype; Homologous to Cas6 (RAMP superfamily protein); Possesses double RRM/ferredoxin fold; also known as Cse3 family.	2.72361e-57
NZ_AP017372.2\|WP_096408428.1\|767487_767928_+\|NfeD-family-protein	gnl\|CDD\|224501	COG1585, COG1585, Membrane protein implicated in regulation of membrane protease activity [Posttranslational modification, protein turnover, chaperones / Intracellular trafficking and secretion].	2.35623e-10
NZ_AP017372.2\|WP_096408418.1\|764624_765014_+\|type-II-toxin-antitoxin-system-VapC-family-toxin	gnl\|CDD\|350221	cd09873, PIN_Pae0151-like, VapC-like PIN domain of the Pyrobaculum aerophilum Pae0151 and Pae2754 proteins and homologs. Virulence associated protein C (VapC)-like PIN (PilT N terminus) domain of the Pyrobaculum aerophilum proteins, Pae0151 and Pae2754, and homologs are included in this subfamily. They are similar to the PIN domains of the Mycobacterium tuberculosis VapC and Neisseria gonorrhoeae FitB toxins of the prokaryotic toxin/antitoxin operons, VapBC and FitAB, respectively, which are believed to be involved in growth inhibition by regulating translation. These toxins are nearly always co-expressed with an antitoxin, a cognate protein inhibitor, forming an inert protein complex. Disassociation of the protein complex activates the ribonuclease activity of the toxin by an, as yet undefined mechanism. The PIN domain belongs to a large nuclease superfamily. The structural properties of the PIN (PilT N terminus) domain indicate its active center, consisting of three highly conserved catalytic residues which coordinate metal ions, in some members, additional metal coordinating residues can be found. Some members of the superfamily lack several of these key catalytic residues. The PIN active site is geometrically similar in the active center of structure-specific 5' nucleases, PIN-domain ribonucleases of eukaryotic rRNA editing proteins, and bacterial toxins of toxin-antitoxin (TA) operons.	4.68453e-27
NZ_AP017372.2\|WP_096408438.1\|771076_771571_-\|SsrA-binding-protein-SmpB	gnl\|CDD\|235455	PRK05422, smpB, SsrA-binding protein SmpB.	8.90918e-84
NZ_AP017372.2\|WP_096408395.1\|750875_753662_+\|CRISPR-associated-helicase/endonuclease-Cas3	gnl\|CDD\|182031	PRK09694, PRK09694, CRISPR-associated helicase/endonuclease Cas3.	5.99445e-148

>NZ_AP017372.2|WP_096408413.1|759667_759967_+|type-I-E-CRISPR-associated-endoribonuclease-Cas2
MAMLVVVTEAVPPRLRGRLAIWLLEVRAGVYVGDVNRRVREMIWEQVNALVEDGNVVMAWSSRHESGFEFQTCGKNRRVPVDYEGLRLVRFAPDPEAEG
>NZ_AP017372.2|WP_096408410.1|758738_759665_+|type-I-E-CRISPR-associated-endonuclease-Cas1
MTTEFVPLKPIPIKDRVSMIFVGRGQLDVRDGAFVVVDEVNGERMHIPVGSVACLLLEPGARISHAAVKLAATVGTLLIWVGEAGVRLYSAGQPGGARSDKLLYQARLALDEKLRLKVVRRMYALRFQEEPPERRSVEQLRGIEGARVRKMYKVLAQKYGVEWKGRSYDPNEWDNADPVNKCLSAATSCLYGVCEAAILAAGYAPAIGFLHTGKPQSFVYDVADIVKFETVVPAAFRVAAQNPAQPDRAVRIACRDSFRDTHVLQRLIPLIEDLLEAGGIDPPPPAPEAQPPAIPEPKSIGDHGHRSK
>NZ_AP017372.2|WP_096408408.1|758032_758734_+|type-I-E-CRISPR-associated-protein-Cas6/Cse3/CasE
MFLSRVHINPQALTPKNLMPVLEGDSYRNHQLLWRLFTEEDERPFLFRQEFEHSFDSSSGKPRGLPLFYVLSRVEPQADSELFSCEVKSFEPKLSAGQQLAFKLRANPVVAKREEGRKNSRHHDVLMDAKRAAKDNGVTDKVAIRCYMDEAAQSWLANKGRSEKAGYTLQSAPEVSGYQQHVHRRKGRDIRFSSVDFQGILTVNDPERFAQSLAEGIGRSRAFGCGMWMVRRV
>NZ_AP017372.2|WP_096408405.1|757295_758033_+|type-I-E-CRISPR-associated-protein-Cas5/CasD
MNYLVFRLYGPLASWGEAAVGPTRPSASYPGRSAILGLLAAALGIRREEEATLAQLRDNVTLAVKQCSAGTLLRDYHTAQVPSHDKKAVWLTRRDELGVAKDKLNTILSAREYRSDGYWVVAIRLSDEAPWTLDEMAEALRHPRFMLYLGRKSCPLAAPLHPRVVSAGGVREALSEEFPGFTGSKMEDDEKRRLGIDAEVSFAWEGDAGDILPQETRYPYDEPLHRGRWQFASRSEHWHQTREES
>NZ_AP017372.2|WP_096408403.1|756247_757285_+|type-I-E-CRISPR-associated-protein-Cas7/Cse4/CasC
MSTFIQLHLLTSYPPANLNRDDLGRPKTARMGGVDRLRVSSQSLKRTWRTSELFEDALVGHVGTRTKRLGTEVYEALTGAGIAEKKSLEWARAIANVFGKIQKSGTEIEQLAHLSPEERQGVDELVATLIQEQRAPTEDELKLLRKNPHAADIGLFGRMLAAHPAFNVEAACQVAHAITVHPVAVEDDYFTAVDDLNFGEEDMGAGHIGETGFAAGLFYSYVCINRDQLIDNLSGDVELADKAIAALTEAAVKVSPKGKQNSFGSRAYASYVLVEKGRQQPRSLSVAFLKPVYGQDQAGTAIKALEGQRESFEKVYGPCAEGHYVLNAVAGEGSLDELKAFLVQN
>NZ_AP017372.2|WP_096408400.1|755613_756222_+|type-I-E-CRISPR-associated-protein-Cse2/CasB
MSRSNINYQVLREAEARSSVYQWWQRVSRAVEADGEGGLPAFSTAVRPALRRAKTPDDALLTEGFRLLWFAVPDNLKAPRNMPALGCVAAVLAEVREMDQQKSFAAAMGSQVEKTGKPRVSELRFQQLQQSHDLEELQRRLRRAVALLGKKVHVLSLADNIMQWHREKSGHPDYRPDRRLPVRWATDYFTELASYQKAAATN
>NZ_AP017372.2|WP_096408398.1|753976_755617_+|type-I-E-CRISPR-associated-protein-Cse1/CasA
MNLIDEPWLPFRLRSGAIEYGPPCELAREDVVDLAPPRADFHGAAWQFLIGLLQTTCPPDDLEEWQAWWADPPTAEQLQEHFARVRHAFNAFGDAPLFMQELDPMEDARSASVASLLIEAPGDQGIKFNTDHFIKRGFGEAMCPRCASLALFTMQVNAPAGGSGYRTGLRGGGPLTTLVLPDDSQAPLWQKLWLNVLNADDLGGGEPDFTDGSVFPWLAATRVSKQAGTEITPEEVHPLHAYWAMPRRFRMHKEEAECRCQVCGAETTEVVREVRAKNYGHNYGGAWVHPLTPYRQDPKKPDEPPLSTKGQQGGLGYRHWEALVLEDTRNHQNLPARVVLDYQEKAEALRDFGSVSQHARLWVFGYDMDNMKARGWYATYMPLLAIPKEQGLRDRFLEWIDAMVQAASDAAWLLRSTVKSAWYSRPKDASGDFSFIDQRFWEGTESAFYSHLHQLAERLPEQDGAFMPEDVARRWHMTLYETALELFDELSLAGDAEALDMKRIVAARNELGKRLWRNKTMKTLRTWAGMEEGVGKSKDKAAKEEA
>NZ_AP017372.2|WP_096408395.1|750875_753662_+|CRISPR-associated-helicase/endonuclease-Cas3
MESLPAYFRYWAKIPKERGFGWDACHLLPYHALDVAATGKYLLDSDEELLERFSAAVQMAPDVFRRLLVFSLALHDLGKFARSFQSLAAIDGVDLVEPDPRYVYRSRHDALALAYWKHYGQECLRNPETGNEWLDAPSELTGRQSLAFWLSVAFGHHGKPVDMEKAALDLAFSPEDKAAAWGFVEDAAALLEPSFPHAQLSDKHWRDHVLKPASWELAGFGVLADWLGSDQSVFGHRAESMPLATYWHEYALPGAEQVVERSGLRGHKEMVAFPGFSQMFGFEPAPLQSWAESVPLADGPQLFLLEDITGAGKTEAALTLAHRLLAAGHRNGVYFALPTQATSNAMYTRVGAVYRDFYSRDSQPSLVLAHGARQLRDDFTRSILPEMAPDTPYTPDDEGGLAQCSQWLADSRKKALLADVGVGTVDQALLGVLPRRHQSLRLLGLARKVLVVDEVHAYDTYTGTLLERLLEAHARHGGSAILLSATIPQSMRRRFLEAWQRGREGGQALQPASEAFPLATHLYSEGLDETPVAARTSSERDLPVDFVHSEEEALSRVVEAARSGRCACWIRNTVDDAIGAYQALRESLPEPDKALLFHARFTMGDRQRIENDALRLFGKESGNAERAGRVLIATQVVEQSLDLDFDVLVSDLAPVELLIQRAGRLYRHARTPDGDLLLSGTDQRESPVFHVHAPEWNDEPDAEWVRRALIGTSYVYPDFGMLWLTMRVLRERGAIRLPAEARLLLEAVYAPEVDVPEGLQRASDEALAEQLSHRSMAGFNVLDLSKGYSGKSVEGGWSDDEEIGTRLSDEPSVQVVLVRVDENQRVKPWNSDTAHPWAMSTVQLRKSQADRLPSLPEELGHEIELLREEVRSLRYARFWLPADERAANHAAYDSLLGAVIPRKGGEQEASTVGTVPHSGSSSNENEEH
>NZ_AP017372.2|WP_096408393.1|750180_750744_-|nucleoside-deaminase
MYIPEFNITLPGWLHEMLSGELQQLPGDEAQMRFVISLAIENIRQESGGPFAAAVFDSSGNLLAPGLNLVTSLHCSILHAEIIALALAQQRIGSHDLSDAGRSHHTLVTSAEPCAMCLGAIPWSGVSRVVFGALDADVREIGFDEGTKPDHWKEALATRGIEVRGEVLRSEAARLLQAYSEKGGPLY
>NZ_AP017372.2|WP_096408390.1|749927_750140_+|hypothetical-protein
MFVFTLAIIIMAALALLSGIAILFYSRSGNSTSSGREFSMAVFFVSALNFVSNSLVFGVVLGVNAMVGFY
>NZ_AP017372.2|WP_096408415.1|763849_764542_+|DUF4338-domain-containing-protein
MLRLHEQGKITLPPSRLRKRRRRATFPPTPATDPQPLLNTPVNMMPKPTFHIVQGNAAQSRCWNEYIARYHYLGYTPLDGHQIRYNVYAGEQLVALLGFGASAWKLADRERFIGWSSEQRERNLSLVVNNTRFLILPWVQVRGLASKILGLAARQLPLDWQQRYGFQPVLLETFVEWPRHTGTCYKAANWQWVGRTTGRGKKSTSHKQRLPTKDIWLYPLRRDFANRLCS
>NZ_AP017372.2|WP_096408418.1|764624_765014_+|type-II-toxin-antitoxin-system-VapC-family-toxin
MDIVADTNIFLAVALNEPDRDRIITLTADASALAPEILPYEIGNALSAMVKRRQLSYSEALEAEKSVRRIPVRLVSTDIRSSLQLALDQDIYAYDAYFLQCAQALSCPLLTLDRRMRQVARELGIRVLE
>NZ_AP017372.2|WP_162549345.1|765234_765834_-|hypothetical-protein
MFLNPPPNMYGFWQPTTAELPIDDWARHEFAHARCGDRRLQERLITVARDFAAHSQADTPEACGTRARTKAAYRFLANPRASMQQLIRSHAQASAGRCRHHDVVLAVQDTTTLNYSAPTITEGLGPIGSRADGAQGLIVHDTMAFSTEGTPLGLIDVYAWARHCEDRGLRRLSGDCYLPYRSNVANQPREERASAEWPC
>NZ_AP017372.2|WP_096408425.1|766204_767125_+|DUF1016-family-protein
MPRYWVIAPIDSQPADFFEKVWRFDIEKEVISIGWSQFGDVSGMSRDELAKVVAHHYPEKPQQTKGLITNMVWSFCHKIEPGDVVIARRGRKILAAVGTVREKAFYKAGKNPDVDHRLFLPVTWHQEPRDKDFGAVVFPMPTLAEIDETQYQSLVEGSGLEVAKSEDGETYENQAEFVLEKYLEEFIVSNFSGIFKGELEVYVDEDGNTGQQYTTDIGSIDILAEDRRNNSLVVIELKKGRPSDQVVGQIMRYMGWVKKNLALEDQKVRGLVICRGEDQRLSYALEMVDHVDIRYYKVSFSLTERP
>NZ_AP017372.2|WP_096408428.1|767487_767928_+|NfeD-family-protein
MISAWNIWLASAIGLLLVDLLLFGGASGVLLAMAGMALFGMGAALLGLSWEFQILSAALSGVLLIPLALKALKKLTPGELSQSLDDPRLRGQQFKVYTDSGGQARVTVFGDEFMARPSSIDQSLKDGSLVRIVRFEGNTAIVTPND
>NZ_AP017372.2|WP_096410315.1|767972_768938_+|paraslipin
MTTLLIVLLAVLLIIIIIKGLVIVPQRHAMVIERLGRYHRTLNAGLNLIIPILDQPRPITIVRYRDNQKTINTEKKIDLREVVLDFPKQEVITKDNVGVRIDGVLYYQIMDAQAAIYGAENLVLAVQTLAQTSLRSEIGRMELDQIFESRQEINARLQNTMDDAGNKWGVKVNRVEIRDIDIPDDIREAMNKQMAAERARRAEVREAEGYKQAEILKAEGDKEAAVQRAEGEKRAIQQILEAAAGTEGLEARDAMRYLIAQEYMETLPKVAQEGERVFIPLEATSLMGSVGGIRELLGPTTGAAAASSSSSSGAGSGGSGG
>NZ_AP017372.2|WP_096408430.1|769016_769352_+|transposase
MVRFGAFHQLLKLKAEEAGAWAVEAPTRQIKPSQTCHACGQQEKKPLSQRWHSCPCGTSCSRDENAARVLLAWLERSLSGREPADAWREVRPGHPLDESALPSKRETHAVA
>NZ_AP017372.2|WP_096408433.1|769400_769673_+|HigA-family-addiction-module-antidote-protein
MLVEEFLRPMQITQRELADAIHVPYQRVNELVNQKRGITPSTALRLARFFGVSADFWLNLQVRWDLYKTQQVEKDELAEIQDVTHWQKMA
>NZ_AP017372.2|WP_096408436.1|770279_771059_-|hypothetical-protein
MEVASAFVAWFYDILAFFGYTHPVHPIFVHITIGLVVAAMVFALIALVPQYNRYAITARDCVTFAFISAVPTMLVGLMDWVHYFGGHLSSLFKIKITLALILIPLLGLAVYLHSKLNIRSILLHIVYLAGFVNIVLLGYYGGELIHASATPHAETAADEDPDRDPDAVTYSQVSRIMQNQCVHCHSRHNDLGGLDLSSYDALMEGGDSGAVVEPGEPQESLLVLMLDGSEEPLMPLGGPELPQSDIDTISKWVEKGAER
>NZ_AP017372.2|WP_096408438.1|771076_771571_-|SsrA-binding-protein-SmpB
MTAVSKKAGKSKAGGGNVIAVNRKAGFDYFIEERLEAGLALEGWEVKSMREKRVNLTESYVLVRRGEAWLVGCNITPLSTASTHIRPDPTRTRKLLLHRREISRLAGSVDRAGYTVVPLQLYWKRGKAKLEIGLAKGKQKQDKRADKKEKDWQRQRERLLKHKV

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_AP017372_5

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_AP017372_5

761958-763756

TypeI-E

I-E

Consensus_repeat	Method
GCGTTCCCCGCGCCTGCGGGGATGAACCG	CRISPRCasFinder
GCGTTCCCCGCGCCTGCGGGGATGAACCG	CRT
GCGTTCCCCGCGCCTGCGGGGATGAACC	PILER-CR
GCGTTCCCCGCGCCTGCGGGGATGAACCG	PILER-CR

29 spacers

cas2,cas1,cas6e,cas5,cas7,cse2gr11,cas8e,cas3,c2c9_V-U4

The CRISPR arrays of NZ_AP017372_5

>merge|NZ_AP017372|5|761958-763756|CRISPRCasFinder,CRT,PILER-CR,PILER-CR
GCGTTCCCCGCGCCTGCGGGGATGAACCTCGGACTCGACCTCCTCCATCGAGCCGTAACTCGCGTTCCCCGCGCCTGCGGGGATGAACCGGTATGAGCGACAGCAATCTTAGCACTGTCAAAGCGTTCCCCGCGCCTGCGGGGATGAACCGGCACAGACGACTACTGAATCTTACGGTTTCCAGCGTTCCCCGCGCCTGCGGGGATGAACCGATAATGCAAGACATGCTAACCGATGCAAATCCGCGTTCCTCGCGCCTGCGGGGATGAACCGATATCCTTAACGCCCTCCGAGACTACTAACCAGCGTTCCCCGCGCCTGCGGGGATGAACCGGTCGGGGCTGTCTTAGTGAGGCCCGACCGGACGCGTTCCCCGCGCCTGCGGGGATGAACCGTACCCTCATCTTCCGATGAGACTAACATATCCGCGTTCCCCGCGCCTGCGGGGATGAACCGGACGACGAAACCATTCGCGCTAGCGAAGAATAGCGTTCCCCGCGCCTGCGGGGATGAACCGAGTTGGGTGCTGAGCTTGTCCCTGCAATGCTTGCGTTCCCCGCGCCTGCGGGGATGAACCGCGTTCAGCTGCTCGCGGACACGCTCTTCGTCAGCGTTCCCCGCGCCTGCGGGGATGAACCGCTGCCCATGGAATATGAGCCGGATCGCCATTGGCGTTCCCCGCGCCTGCGGGGATGAACCATCCCGCGTCTATACCGACAAGAGTTTGGGCGCGCGTTCCCCGCGCCTGCGGGGATGAACCGTTTGCCGCGGAACACCCTGAAGCCACGCCAGAGCGTTCCCCGCGCCTGCGGGGATGAACCGATAACCGGCGGCGGTGAGCCGTCAGATGAGTGGCGTTCCCCGCGCCTGCGGGGATGAACCGAGTTTAGACCCGAGCGAGTACGGACAGCAGGCGCGTTCCCCGCGCCTGCGGGGATGAACCGGTTGAGTTGCAAACCACCGACCTGCCTACAGAGCGTTCCCCGCGCCTGCGGGGATGAACCGTTCGCCGGTAGAAAGCTGATTTTCAAGCGCGACGCGTTCCCCGCGCCTGCGGGGATGAACCGTATCACTGGTTGTACGGCGCACCGCTGCTTGCGCGTTCCCCGCGCCTGCGGGGATGAACCGATTACGGCACGGGGCGATCAGGGAAACGGGTCGCGTTCCCCGCGCCTGCGGGGATGAACCGGCGCAACAGTTCATCACCGTATGACGTGTACGGCGTTCCCCGCGCCTGCGGGGATGAACCGCCCTGGCGCCCGGACGATGCCCGTGTCTATCAGCGTTCCCCGCGCCTGCGGGGATGAACCGATGAACCGATCACCAGCCTTGTCCCACGGCAAGCGTTCCCCGCGCCTGCGGGGATGAACCGTCCTTGAGTCTTTGTGGAGATACACTAATGGAGCGTTCCCCGCGCCTGCGGGGATGAACCGGCGATGGAGCTGTTTGGCGCGCGCTACTTTAGGCGTTCCCCGCGCCTGCGGGGATGAACCGGGCCGATGGCAAGTGCGGATAGAGGATTTGAGGCGTTCCCCGCGCCTGCGGGGATGAACCGAAAGGCTGGTTAGGTGGCATCAGAGCCATTAAGCGTTCCCCGCGCCTGCGGGGATGAACCGTCCGGTAGGGGCATAGGACGTAAAGCGAACCCGCGTTCCCCGCGCCTGCGGGGATGAACCGTGTTCAGCACAGCCTTGTTGCTTGAACTCTCGGCGTTCCCCGCGCCTGCGGGGATGAACCGTCATCGGTAGTCATTAAATCTGCTACTCGTATGCGTTCCCCGCGCCTGCGGGGATGAACCG

>NZ_AP017372|5|4|761958-763756|CRISPRCasFinder
GCGTTCCCCGCGCCTGCGGGGATGAACCT	CGGACTCGACCTCCTCCATCGAGCCGTAACTC
GCGTTCCCCGCGCCTGCGGGGATGAACCG	GTATGAGCGACAGCAATCTTAGCACTGTCAAA
GCGTTCCCCGCGCCTGCGGGGATGAACCG	GCACAGACGACTACTGAATCTTACGGTTTCCA
GCGTTCCCCGCGCCTGCGGGGATGAACCG	ATAATGCAAGACATGCTAACCGATGCAAATCC
GCGTTCCTCGCGCCTGCGGGGATGAACCG	ATATCCTTAACGCCCTCCGAGACTACTAACCA
GCGTTCCCCGCGCCTGCGGGGATGAACCG	GTCGGGGCTGTCTTAGTGAGGCCCGACCGGAC
GCGTTCCCCGCGCCTGCGGGGATGAACCG	TACCCTCATCTTCCGATGAGACTAACATATCC
GCGTTCCCCGCGCCTGCGGGGATGAACCG	GACGACGAAACCATTCGCGCTAGCGAAGAATA
GCGTTCCCCGCGCCTGCGGGGATGAACCG	AGTTGGGTGCTGAGCTTGTCCCTGCAATGCTT
GCGTTCCCCGCGCCTGCGGGGATGAACCG	CGTTCAGCTGCTCGCGGACACGCTCTTCGTCA
GCGTTCCCCGCGCCTGCGGGGATGAACCG	CTGCCCATGGAATATGAGCCGGATCGCCATTG
GCGTTCCCCGCGCCTGCGGGGATGAACCA	TCCCGCGTCTATACCGACAAGAGTTTGGGCGC
GCGTTCCCCGCGCCTGCGGGGATGAACCG	TTTGCCGCGGAACACCCTGAAGCCACGCCAGA
GCGTTCCCCGCGCCTGCGGGGATGAACCG	ATAACCGGCGGCGGTGAGCCGTCAGATGAGTG
GCGTTCCCCGCGCCTGCGGGGATGAACCG	AGTTTAGACCCGAGCGAGTACGGACAGCAGGC
GCGTTCCCCGCGCCTGCGGGGATGAACCG	GTTGAGTTGCAAACCACCGACCTGCCTACAGA
GCGTTCCCCGCGCCTGCGGGGATGAACCG	TTCGCCGGTAGAAAGCTGATTTTCAAGCGCGAC
GCGTTCCCCGCGCCTGCGGGGATGAACCG	TATCACTGGTTGTACGGCGCACCGCTGCTTGC
GCGTTCCCCGCGCCTGCGGGGATGAACCG	ATTACGGCACGGGGCGATCAGGGAAACGGGTC
GCGTTCCCCGCGCCTGCGGGGATGAACCG	GCGCAACAGTTCATCACCGTATGACGTGTACG
GCGTTCCCCGCGCCTGCGGGGATGAACCG	CCCTGGCGCCCGGACGATGCCCGTGTCTATCA
GCGTTCCCCGCGCCTGCGGGGATGAACCG	ATGAACCGATCACCAGCCTTGTCCCACGGCAA
GCGTTCCCCGCGCCTGCGGGGATGAACCG	TCCTTGAGTCTTTGTGGAGATACACTAATGGA
GCGTTCCCCGCGCCTGCGGGGATGAACCG	GCGATGGAGCTGTTTGGCGCGCGCTACTTTAG
GCGTTCCCCGCGCCTGCGGGGATGAACCG	GGCCGATGGCAAGTGCGGATAGAGGATTTGAG
GCGTTCCCCGCGCCTGCGGGGATGAACCG	AAAGGCTGGTTAGGTGGCATCAGAGCCATTAA
GCGTTCCCCGCGCCTGCGGGGATGAACCG	TCCGGTAGGGGCATAGGACGTAAAGCGAACCC
GCGTTCCCCGCGCCTGCGGGGATGAACCG	TGTTCAGCACAGCCTTGTTGCTTGAACTCTCG
GCGTTCCCCGCGCCTGCGGGGATGAACCG	TCATCGGTAGTCATTAAATCTGCTACTCGTAT
GCGTTCCCCGCGCCTGCGGGGATGAACCG

>NZ_AP017372|5|2|761958-763756|CRT
GCGTTCCCCGCGCCTGCGGGGATGAACCT	CGGACTCGACCTCCTCCATCGAGCCGTAACTC
GCGTTCCCCGCGCCTGCGGGGATGAACCG	GTATGAGCGACAGCAATCTTAGCACTGTCAAA
GCGTTCCCCGCGCCTGCGGGGATGAACCG	GCACAGACGACTACTGAATCTTACGGTTTCCA
GCGTTCCCCGCGCCTGCGGGGATGAACCG	ATAATGCAAGACATGCTAACCGATGCAAATCC
GCGTTCCTCGCGCCTGCGGGGATGAACCG	ATATCCTTAACGCCCTCCGAGACTACTAACCA
GCGTTCCCCGCGCCTGCGGGGATGAACCG	GTCGGGGCTGTCTTAGTGAGGCCCGACCGGAC
GCGTTCCCCGCGCCTGCGGGGATGAACCG	TACCCTCATCTTCCGATGAGACTAACATATCC
GCGTTCCCCGCGCCTGCGGGGATGAACCG	GACGACGAAACCATTCGCGCTAGCGAAGAATA
GCGTTCCCCGCGCCTGCGGGGATGAACCG	AGTTGGGTGCTGAGCTTGTCCCTGCAATGCTT
GCGTTCCCCGCGCCTGCGGGGATGAACCG	CGTTCAGCTGCTCGCGGACACGCTCTTCGTCA
GCGTTCCCCGCGCCTGCGGGGATGAACCG	CTGCCCATGGAATATGAGCCGGATCGCCATTG
GCGTTCCCCGCGCCTGCGGGGATGAACCA	TCCCGCGTCTATACCGACAAGAGTTTGGGCGC
GCGTTCCCCGCGCCTGCGGGGATGAACCG	TTTGCCGCGGAACACCCTGAAGCCACGCCAGA
GCGTTCCCCGCGCCTGCGGGGATGAACCG	ATAACCGGCGGCGGTGAGCCGTCAGATGAGTG
GCGTTCCCCGCGCCTGCGGGGATGAACCG	AGTTTAGACCCGAGCGAGTACGGACAGCAGGC
GCGTTCCCCGCGCCTGCGGGGATGAACCG	GTTGAGTTGCAAACCACCGACCTGCCTACAGA
GCGTTCCCCGCGCCTGCGGGGATGAACCG	TTCGCCGGTAGAAAGCTGATTTTCAAGCGCGAC
GCGTTCCCCGCGCCTGCGGGGATGAACCG	TATCACTGGTTGTACGGCGCACCGCTGCTTGC
GCGTTCCCCGCGCCTGCGGGGATGAACCG	ATTACGGCACGGGGCGATCAGGGAAACGGGTC
GCGTTCCCCGCGCCTGCGGGGATGAACCG	GCGCAACAGTTCATCACCGTATGACGTGTACG
GCGTTCCCCGCGCCTGCGGGGATGAACCG	CCCTGGCGCCCGGACGATGCCCGTGTCTATCA
GCGTTCCCCGCGCCTGCGGGGATGAACCG	ATGAACCGATCACCAGCCTTGTCCCACGGCAA
GCGTTCCCCGCGCCTGCGGGGATGAACCG	TCCTTGAGTCTTTGTGGAGATACACTAATGGA
GCGTTCCCCGCGCCTGCGGGGATGAACCG	GCGATGGAGCTGTTTGGCGCGCGCTACTTTAG
GCGTTCCCCGCGCCTGCGGGGATGAACCG	GGCCGATGGCAAGTGCGGATAGAGGATTTGAG
GCGTTCCCCGCGCCTGCGGGGATGAACCG	AAAGGCTGGTTAGGTGGCATCAGAGCCATTAA
GCGTTCCCCGCGCCTGCGGGGATGAACCG	TCCGGTAGGGGCATAGGACGTAAAGCGAACCC
GCGTTCCCCGCGCCTGCGGGGATGAACCG	TGTTCAGCACAGCCTTGTTGCTTGAACTCTCG
GCGTTCCCCGCGCCTGCGGGGATGAACCG	TCATCGGTAGTCATTAAATCTGCTACTCGTAT
GCGTTCCCCGCGCCTGCGGGGATGAACCG

>NZ_AP017372|5|3|762141-762900|PILER-CR
GCGTTCCCCGCGCCTGCGGGGATGAACC	GATAATGCAAGACATGCTAACCGATGCAAATCC
GCGTTCCTCGCGCCTGCGGGGATGAACC	GATATCCTTAACGCCCTCCGAGACTACTAACCA
GCGTTCCCCGCGCCTGCGGGGATGAACC	GGTCGGGGCTGTCTTAGTGAGGCCCGACCGGAC
GCGTTCCCCGCGCCTGCGGGGATGAACC	GTACCCTCATCTTCCGATGAGACTAACATATCC
GCGTTCCCCGCGCCTGCGGGGATGAACC	GGACGACGAAACCATTCGCGCTAGCGAAGAATA
GCGTTCCCCGCGCCTGCGGGGATGAACC	GAGTTGGGTGCTGAGCTTGTCCCTGCAATGCTT
GCGTTCCCCGCGCCTGCGGGGATGAACC	GCGTTCAGCTGCTCGCGGACACGCTCTTCGTCA
GCGTTCCCCGCGCCTGCGGGGATGAACC	GCTGCCCATGGAATATGAGCCGGATCGCCATTG
GCGTTCCCCGCGCCTGCGGGGATGAACC	ATCCCGCGTCTATACCGACAAGAGTTTGGGCGC
GCGTTCCCCGCGCCTGCGGGGATGAACC	GTTTGCCGCGGAACACCCTGAAGCCACGCCAGA
GCGTTCCCCGCGCCTGCGGGGATGAACC	GATAACCGGCGGCGGTGAGCCGTCAGATGAGTG
GCGTTCCCCGCGCCTGCGGGGATGAACC	GAGTTTAGACCCGAGCGAGTACGGACAGCAGGC
GCGTTCCCCGCGCCTGCGGGGATGAACCGGTTGAGTTGCAAACCACCGACCTGCCTACAGAGCGTTCCCCGCGCCTGCGGGGATGAACCGTTCGCCGGTAGAAAGCTGATTTTCAAGCGCGACGCGTTCCCCGCGCCTGCGGGGATGAACCG	TATCACTGGTTGTACGGCGCACCGCTGCTTGC
GCGTTCCCCGCGCCTGCGGGGATGAACCG	ATTACGGCACGGGGCGATCAGGGAAACGGGTC
GCGTTCCCCGCGCCTGCGGGGATGAACCG	GCGCAACAGTTCATCACCGTATGACGTGTACG
GCGTTCCCCGCGCCTGCGGGGATGAACCG	CCCTGGCGCCCGGACGATGCCCGTGTCTATCA
GCGTTCCCCGCGCCTGCGGGGATGAACCG	ATGAACCGATCACCAGCCTTGTCCCACGGCAA
GCGTTCCCCGCGCCTGCGGGGATGAACCG	TCCTTGAGTCTTTGTGGAGATACACTAATGGA
GCGTTCCCCGCGCCTGCGGGGATGAACCG	GCGATGGAGCTGTTTGGCGCGCGCTACTTTAG
GCGTTCCCCGCGCCTGCGGGGATGAACCG	GGCCGATGGCAAGTGCGGATAGAGGATTTGAG
GCGTTCCCCGCGCCTGCGGGGATGAACCG	AAAGGCTGGTTAGGTGGCATCAGAGCCATTAA
GCGTTCCCCGCGCCTGCGGGGATGAACCG	TCCGGTAGGGGCATAGGACGTAAAGCGAACCC
GCGTTCCCCGCGCCTGCGGGGATGAACCG	TGTTCAGCACAGCCTTGTTGCTTGAACTCTCG
GCGTTCCCCGCGCCTGCGGGGATGAACCG	TCATCGGTAGTCATTAAATCTGCTACTCGTAT


>NZ_AP017372|5|4|762996-763756|PILER-CR
	GATAATGCAAGACATGCTAACCGATGCAAATCC
GCGTTCCTCGCGCCTGCGGGGATGAACC	GATATCCTTAACGCCCTCCGAGACTACTAACCA
GCGTTCCCCGCGCCTGCGGGGATGAACC	GGTCGGGGCTGTCTTAGTGAGGCCCGACCGGAC
GCGTTCCCCGCGCCTGCGGGGATGAACC	GTACCCTCATCTTCCGATGAGACTAACATATCC
GCGTTCCCCGCGCCTGCGGGGATGAACC	GGACGACGAAACCATTCGCGCTAGCGAAGAATA
GCGTTCCCCGCGCCTGCGGGGATGAACC	GAGTTGGGTGCTGAGCTTGTCCCTGCAATGCTT
GCGTTCCCCGCGCCTGCGGGGATGAACC	GCGTTCAGCTGCTCGCGGACACGCTCTTCGTCA
GCGTTCCCCGCGCCTGCGGGGATGAACC	GCTGCCCATGGAATATGAGCCGGATCGCCATTG
GCGTTCCCCGCGCCTGCGGGGATGAACC	ATCCCGCGTCTATACCGACAAGAGTTTGGGCGC
GCGTTCCCCGCGCCTGCGGGGATGAACC	GTTTGCCGCGGAACACCCTGAAGCCACGCCAGA
GCGTTCCCCGCGCCTGCGGGGATGAACC	GATAACCGGCGGCGGTGAGCCGTCAGATGAGTG
GCGTTCCCCGCGCCTGCGGGGATGAACC	GAGTTTAGACCCGAGCGAGTACGGACAGCAGGC
GCGTTCCCCGCGCCTGCGGGGATGAACCGGTTGAGTTGCAAACCACCGACCTGCCTACAGAGCGTTCCCCGCGCCTGCGGGGATGAACCGTTCGCCGGTAGAAAGCTGATTTTCAAGCGCGACGCGTTCCCCGCGCCTGCGGGGATGAACCG	TATCACTGGTTGTACGGCGCACCGCTGCTTGC
GCGTTCCCCGCGCCTGCGGGGATGAACCG	ATTACGGCACGGGGCGATCAGGGAAACGGGTC
GCGTTCCCCGCGCCTGCGGGGATGAACCG	GCGCAACAGTTCATCACCGTATGACGTGTACG
GCGTTCCCCGCGCCTGCGGGGATGAACCG	CCCTGGCGCCCGGACGATGCCCGTGTCTATCA
GCGTTCCCCGCGCCTGCGGGGATGAACCG	ATGAACCGATCACCAGCCTTGTCCCACGGCAA
GCGTTCCCCGCGCCTGCGGGGATGAACCG	TCCTTGAGTCTTTGTGGAGATACACTAATGGA
GCGTTCCCCGCGCCTGCGGGGATGAACCG	GCGATGGAGCTGTTTGGCGCGCGCTACTTTAG
GCGTTCCCCGCGCCTGCGGGGATGAACCG	GGCCGATGGCAAGTGCGGATAGAGGATTTGAG
GCGTTCCCCGCGCCTGCGGGGATGAACCG	AAAGGCTGGTTAGGTGGCATCAGAGCCATTAA
GCGTTCCCCGCGCCTGCGGGGATGAACCG	TCCGGTAGGGGCATAGGACGTAAAGCGAACCC
GCGTTCCCCGCGCCTGCGGGGATGAACCG	TGTTCAGCACAGCCTTGTTGCTTGAACTCTCG
GCGTTCCCCGCGCCTGCGGGGATGAACCG	TCATCGGTAGTCATTAAATCTGCTACTCGTAT
GCGTTCCCCGCGCCTGCGGGGATGAACCG

Protein	Signature genes	Signature genes Name	Protein_function
NZ_AP017372.2\|WP_096408436.1\|770279_771059_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|369445
NZ_AP017372.2\|WP_096408403.1\|756247_757285_+\|type-I-E-CRISPR-associated-protein-Cas7/Cse4/CasC	cas7	pfam09344_cas7_CAS-I-E	gnl\|CDD\|378153
NZ_AP017372.2\|WP_096408400.1\|755613_756222_+\|type-I-E-CRISPR-associated-protein-Cse2/CasB	cse2gr11	cd09731_cse2gr11_CAS-I-E	gnl\|CDD\|187862
NZ_AP017372.2\|WP_096408393.1\|750180_750744_-\|nucleoside-deaminase	unknown	unknown	gnl\|CDD\|238612
NZ_AP017372.2\|WP_096408410.1\|758738_759665_+\|type-I-E-CRISPR-associated-endonuclease-Cas1	cas1	cd09719_cas1_CAS-I-E	gnl\|CDD\|274693
NZ_AP017372.2\|WP_096408390.1\|749927_750140_+\|hypothetical-protein	unknown	unknown	unknown
NZ_AP017372.2\|WP_162549345.1\|765234_765834_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|373239
NZ_AP017372.2\|WP_096408430.1\|769016_769352_+\|transposase	c2c9_V-U4	-	gnl\|CDD\|284650
NZ_AP017372.2\|WP_096408413.1\|759667_759967_+\|type-I-E-CRISPR-associated-endoribonuclease-Cas2	cas2	pfam09707_cas2_CAS-I-E	gnl\|CDD\|236930
NZ_AP017372.2\|WP_096408425.1\|766204_767125_+\|DUF1016-family-protein	unknown	unknown	gnl\|CDD\|235264
NZ_AP017372.2\|WP_096408433.1\|769400_769673_+\|HigA-family-addiction-module-antidote-protein	unknown	unknown	gnl\|CDD\|274228
NZ_AP017372.2\|WP_096408415.1\|763849_764542_+\|DUF4338-domain-containing-protein	unknown	unknown	gnl\|CDD\|372975
NZ_AP017372.2\|WP_096408398.1\|753976_755617_+\|type-I-E-CRISPR-associated-protein-Cse1/CasA	cas8e	pfam09481_cas8e_CAS-I-E	gnl\|CDD\|187860
NZ_AP017372.2\|WP_096408405.1\|757295_758033_+\|type-I-E-CRISPR-associated-protein-Cas5/CasD	cas5	cd09645_cas5_CAS-I-E	gnl\|CDD\|187886
NZ_AP017372.2\|WP_096410315.1\|767972_768938_+\|paraslipin	unknown	unknown	gnl\|CDD\|223407
NZ_AP017372.2\|WP_096408408.1\|758032_758734_+\|type-I-E-CRISPR-associated-protein-Cas6/Cse3/CasE	cas6e	cd09727_cas6e_CAS-I-E	gnl\|CDD\|187858
NZ_AP017372.2\|WP_096408428.1\|767487_767928_+\|NfeD-family-protein	unknown	unknown	gnl\|CDD\|224501
NZ_AP017372.2\|WP_096408418.1\|764624_765014_+\|type-II-toxin-antitoxin-system-VapC-family-toxin	unknown	unknown	gnl\|CDD\|350221
NZ_AP017372.2\|WP_096408438.1\|771076_771571_-\|SsrA-binding-protein-SmpB	unknown	unknown	gnl\|CDD\|235455
NZ_AP017372.2\|WP_096408395.1\|750875_753662_+\|CRISPR-associated-helicase/endonuclease-Cas3	cas3	COG1203_cas3_CAS-I	gnl\|CDD\|182031

Protein	Function_ID	Function_description	E-value
NZ_AP017372.2\|WP_096408403.1\|756247_757285_+\|type-I-E-CRISPR-associated-protein-Cas7/Cse4/CasC	gnl\|CDD\|378153	pfam09344, Cas_CT1975, CT1975-like protein. CRISPR is a term for Clustered, Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This family is represented by CT1975 of Chlorobium tepidum.	1.89345e-119
NZ_AP017372.2\|WP_096408400.1\|755613_756222_+\|type-I-E-CRISPR-associated-protein-Cse2/CasB	gnl\|CDD\|187862	cd09731, Cse2_I-E, CRISPR/Cas system-associated protein Cse2. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Small alpha-helical protein; also known as Cse2/CasB/YgcK family; specific gene for I-E subtype;.	3.0859e-23
NZ_AP017372.2\|WP_096408393.1\|750180_750744_-\|nucleoside-deaminase	gnl\|CDD\|238612	cd01285, nucleoside_deaminase, Nucleoside deaminases include adenosine, guanine and cytosine deaminases. These enzymes are Zn dependent and catalyze the deamination of nucleosides. The zinc ion in the active site plays a central role in the proposed catalytic mechanism, activating a water molecule to form a hydroxide ion that performs a nucleophilic attack on the substrate. The functional enzyme is a homodimer. Cytosine deaminase catalyzes the deamination of cytosine to uracil and ammonia and is a member of the pyrimidine salvage pathway. Cytosine deaminase is found in bacteria and fungi but is not present in mammals; for this reason, the enzyme is currently of interest for antimicrobial drug design and gene therapy applications against tumors. Some members of this family are tRNA-specific adenosine deaminases that generate inosine at the first position of their anticodon (position 34) of specific tRNAs; this modification is thought to enlarge the codon recognition capacity during protein synthesis. Other members of the family are guanine deaminases which deaminate guanine to xanthine as part of the utilization of guanine as a nitrogen source.	2.86166e-31
NZ_AP017372.2\|WP_096408410.1\|758738_759665_+\|type-I-E-CRISPR-associated-endonuclease-Cas1	gnl\|CDD\|274693	TIGR03638, cas1_ECOLI, CRISPR-associated endonuclease Cas1, subtype I-E/ECOLI. The CRISPR-associated protein Cas1 is virtually universal to CRISPR systems. CRISPR, an acronym for Clustered Regularly Interspaced Short Palindromic Repeats, is prokaryotic immunity system for foreign DNA, mostly from phage. CRISPR systems belong to different subtypes, distinguished by both nature of the repeats, the makeup of the cohort of associated Cas proteins, and by molecular phylogeny within the more universal Cas proteins such as this one. This model is of type EXCEPTION and provides more specific information than the EQUIVALOG model TIGR00287. It describes the Cas1 protein particular to the ECOLI subtype of CRISPR/Cas system.	2.98711e-150
NZ_AP017372.2\|WP_162549345.1\|765234_765834_-\|hypothetical-protein	gnl\|CDD\|373239	pfam14706, Tnp_DNA_bind, Transposase DNA-binding. This domain occurs at the C-terminus of transposases including E. coli tnpA. TnpA encodes a transposase and an inhibitor protein, the inhibitor only differs from the transposase by the absence of the N-terminal 55 amino acids, which includes most of this domain. This domain consists of alpha helices and turns, and functions as a DNA-binding domain.	2.95429e-18
NZ_AP017372.2\|WP_096408436.1\|770279_771059_-\|hypothetical-protein	gnl\|CDD\|369445	pfam07635, PSCyt1, Planctomycete cytochrome C. These proteins share a region of homology at their N-terminus that contains the C-{CPWHF}-{CPWR}-C-H-{CFYW} motif typical of cytochromes C, or CxxCH.	5.2208e-11
NZ_AP017372.2\|WP_096408430.1\|769016_769352_+\|transposase	gnl\|CDD\|284650	pfam07282, OrfB_Zn_ribbon, Putative transposase DNA-binding domain. This putative domain is found at the C-terminus of a large number of transposase proteins. This domain contains four conserved cysteines suggestive of a zinc binding domain. Given the need for transposases to bind DNA as well as the large number of DNA-binding zinc fingers we hypothesize this domain is DNA-binding.	2.59529e-13
NZ_AP017372.2\|WP_096408413.1\|759667_759967_+\|type-I-E-CRISPR-associated-endoribonuclease-Cas2	gnl\|CDD\|236930	PRK11558, PRK11558, putative ssRNA endonuclease; Provisional.	6.77901e-57
NZ_AP017372.2\|WP_096408425.1\|766204_767125_+\|DUF1016-family-protein	gnl\|CDD\|235264	PRK04247, PRK04247, endonuclease NucS.	9.04348e-07
NZ_AP017372.2\|WP_096408433.1\|769400_769673_+\|HigA-family-addiction-module-antidote-protein	gnl\|CDD\|274228	TIGR02607, Virulence-associated_protein_I, addiction module antidote protein, HigA family. Members of this family form a distinct clade within the larger family HTH_3 of helix-turn-helix proteins, described by pfam01381. Members of this clade are strictly bacterial and nearly always shorter than 110 amino acids. This family includes the characterized member HigA, without which the killer protein HigB cannot be cloned. The hig (host inhibition of growth) system is noted to be unusual in that killer protein is uncoded by the upstream member of the gene pair. [Regulatory functions, DNA interactions, Regulatory functions, Protein interactions, Mobile and extrachromosomal element functions, Other].	1.27475e-30
NZ_AP017372.2\|WP_096408415.1\|763849_764542_+\|DUF4338-domain-containing-protein	gnl\|CDD\|372975	pfam14236, DUF4338, Domain of unknown function (DUF4338). This family of proteins is functionally uncharacterized. This family of proteins is found in bacteria. Proteins in this family are typically between 206 and 475 amino acids in length.	4.42393e-70
NZ_AP017372.2\|WP_096408398.1\|753976_755617_+\|type-I-E-CRISPR-associated-protein-Cse1/CasA	gnl\|CDD\|187860	cd09729, Cse1_I-E, CRISPR/Cas system-associated protein Cse1. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Large proteins, some contain Zn-finger domain; subunit of the Cascade complex; signature gene for I-E subtype; also known as Cse1/CasA/YgcL family.	1.53843e-141
NZ_AP017372.2\|WP_096408405.1\|757295_758033_+\|type-I-E-CRISPR-associated-protein-Cas5/CasD	gnl\|CDD\|187886	cd09756, Cas5_I-E, CRISPR/Cas system-associated RAMP superfamily protein Cas5. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas5 is a RAMP superfamily protein; Subunit of the Cascade complex.	1.50536e-44
NZ_AP017372.2\|WP_096410315.1\|767972_768938_+\|paraslipin	gnl\|CDD\|223407	COG0330, HflC, Membrane protease subunits, stomatin/prohibitin homologs [Posttranslational modification, protein turnover, chaperones].	1.90312e-59
NZ_AP017372.2\|WP_096408408.1\|758032_758734_+\|type-I-E-CRISPR-associated-protein-Cas6/Cse3/CasE	gnl\|CDD\|187858	cd09727, Cas6_I-E, CRISPR/Cas system-associated RAMP superfamily protein Cas6e. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas6e is an endoribonuclease that generates crRNA; This family is specific for CRISPR/Cas system I-E subtype; Homologous to Cas6 (RAMP superfamily protein); Possesses double RRM/ferredoxin fold; also known as Cse3 family.	2.72361e-57
NZ_AP017372.2\|WP_096408428.1\|767487_767928_+\|NfeD-family-protein	gnl\|CDD\|224501	COG1585, COG1585, Membrane protein implicated in regulation of membrane protease activity [Posttranslational modification, protein turnover, chaperones / Intracellular trafficking and secretion].	2.35623e-10
NZ_AP017372.2\|WP_096408418.1\|764624_765014_+\|type-II-toxin-antitoxin-system-VapC-family-toxin	gnl\|CDD\|350221	cd09873, PIN_Pae0151-like, VapC-like PIN domain of the Pyrobaculum aerophilum Pae0151 and Pae2754 proteins and homologs. Virulence associated protein C (VapC)-like PIN (PilT N terminus) domain of the Pyrobaculum aerophilum proteins, Pae0151 and Pae2754, and homologs are included in this subfamily. They are similar to the PIN domains of the Mycobacterium tuberculosis VapC and Neisseria gonorrhoeae FitB toxins of the prokaryotic toxin/antitoxin operons, VapBC and FitAB, respectively, which are believed to be involved in growth inhibition by regulating translation. These toxins are nearly always co-expressed with an antitoxin, a cognate protein inhibitor, forming an inert protein complex. Disassociation of the protein complex activates the ribonuclease activity of the toxin by an, as yet undefined mechanism. The PIN domain belongs to a large nuclease superfamily. The structural properties of the PIN (PilT N terminus) domain indicate its active center, consisting of three highly conserved catalytic residues which coordinate metal ions, in some members, additional metal coordinating residues can be found. Some members of the superfamily lack several of these key catalytic residues. The PIN active site is geometrically similar in the active center of structure-specific 5' nucleases, PIN-domain ribonucleases of eukaryotic rRNA editing proteins, and bacterial toxins of toxin-antitoxin (TA) operons.	4.68453e-27
NZ_AP017372.2\|WP_096408438.1\|771076_771571_-\|SsrA-binding-protein-SmpB	gnl\|CDD\|235455	PRK05422, smpB, SsrA-binding protein SmpB.	8.90918e-84
NZ_AP017372.2\|WP_096408395.1\|750875_753662_+\|CRISPR-associated-helicase/endonuclease-Cas3	gnl\|CDD\|182031	PRK09694, PRK09694, CRISPR-associated helicase/endonuclease Cas3.	5.99445e-148

>NZ_AP017372.2|WP_096408413.1|759667_759967_+|type-I-E-CRISPR-associated-endoribonuclease-Cas2
MAMLVVVTEAVPPRLRGRLAIWLLEVRAGVYVGDVNRRVREMIWEQVNALVEDGNVVMAWSSRHESGFEFQTCGKNRRVPVDYEGLRLVRFAPDPEAEG
>NZ_AP017372.2|WP_096408410.1|758738_759665_+|type-I-E-CRISPR-associated-endonuclease-Cas1
MTTEFVPLKPIPIKDRVSMIFVGRGQLDVRDGAFVVVDEVNGERMHIPVGSVACLLLEPGARISHAAVKLAATVGTLLIWVGEAGVRLYSAGQPGGARSDKLLYQARLALDEKLRLKVVRRMYALRFQEEPPERRSVEQLRGIEGARVRKMYKVLAQKYGVEWKGRSYDPNEWDNADPVNKCLSAATSCLYGVCEAAILAAGYAPAIGFLHTGKPQSFVYDVADIVKFETVVPAAFRVAAQNPAQPDRAVRIACRDSFRDTHVLQRLIPLIEDLLEAGGIDPPPPAPEAQPPAIPEPKSIGDHGHRSK
>NZ_AP017372.2|WP_096408408.1|758032_758734_+|type-I-E-CRISPR-associated-protein-Cas6/Cse3/CasE
MFLSRVHINPQALTPKNLMPVLEGDSYRNHQLLWRLFTEEDERPFLFRQEFEHSFDSSSGKPRGLPLFYVLSRVEPQADSELFSCEVKSFEPKLSAGQQLAFKLRANPVVAKREEGRKNSRHHDVLMDAKRAAKDNGVTDKVAIRCYMDEAAQSWLANKGRSEKAGYTLQSAPEVSGYQQHVHRRKGRDIRFSSVDFQGILTVNDPERFAQSLAEGIGRSRAFGCGMWMVRRV
>NZ_AP017372.2|WP_096408405.1|757295_758033_+|type-I-E-CRISPR-associated-protein-Cas5/CasD
MNYLVFRLYGPLASWGEAAVGPTRPSASYPGRSAILGLLAAALGIRREEEATLAQLRDNVTLAVKQCSAGTLLRDYHTAQVPSHDKKAVWLTRRDELGVAKDKLNTILSAREYRSDGYWVVAIRLSDEAPWTLDEMAEALRHPRFMLYLGRKSCPLAAPLHPRVVSAGGVREALSEEFPGFTGSKMEDDEKRRLGIDAEVSFAWEGDAGDILPQETRYPYDEPLHRGRWQFASRSEHWHQTREES
>NZ_AP017372.2|WP_096408403.1|756247_757285_+|type-I-E-CRISPR-associated-protein-Cas7/Cse4/CasC
MSTFIQLHLLTSYPPANLNRDDLGRPKTARMGGVDRLRVSSQSLKRTWRTSELFEDALVGHVGTRTKRLGTEVYEALTGAGIAEKKSLEWARAIANVFGKIQKSGTEIEQLAHLSPEERQGVDELVATLIQEQRAPTEDELKLLRKNPHAADIGLFGRMLAAHPAFNVEAACQVAHAITVHPVAVEDDYFTAVDDLNFGEEDMGAGHIGETGFAAGLFYSYVCINRDQLIDNLSGDVELADKAIAALTEAAVKVSPKGKQNSFGSRAYASYVLVEKGRQQPRSLSVAFLKPVYGQDQAGTAIKALEGQRESFEKVYGPCAEGHYVLNAVAGEGSLDELKAFLVQN
>NZ_AP017372.2|WP_096408400.1|755613_756222_+|type-I-E-CRISPR-associated-protein-Cse2/CasB
MSRSNINYQVLREAEARSSVYQWWQRVSRAVEADGEGGLPAFSTAVRPALRRAKTPDDALLTEGFRLLWFAVPDNLKAPRNMPALGCVAAVLAEVREMDQQKSFAAAMGSQVEKTGKPRVSELRFQQLQQSHDLEELQRRLRRAVALLGKKVHVLSLADNIMQWHREKSGHPDYRPDRRLPVRWATDYFTELASYQKAAATN
>NZ_AP017372.2|WP_096408398.1|753976_755617_+|type-I-E-CRISPR-associated-protein-Cse1/CasA
MNLIDEPWLPFRLRSGAIEYGPPCELAREDVVDLAPPRADFHGAAWQFLIGLLQTTCPPDDLEEWQAWWADPPTAEQLQEHFARVRHAFNAFGDAPLFMQELDPMEDARSASVASLLIEAPGDQGIKFNTDHFIKRGFGEAMCPRCASLALFTMQVNAPAGGSGYRTGLRGGGPLTTLVLPDDSQAPLWQKLWLNVLNADDLGGGEPDFTDGSVFPWLAATRVSKQAGTEITPEEVHPLHAYWAMPRRFRMHKEEAECRCQVCGAETTEVVREVRAKNYGHNYGGAWVHPLTPYRQDPKKPDEPPLSTKGQQGGLGYRHWEALVLEDTRNHQNLPARVVLDYQEKAEALRDFGSVSQHARLWVFGYDMDNMKARGWYATYMPLLAIPKEQGLRDRFLEWIDAMVQAASDAAWLLRSTVKSAWYSRPKDASGDFSFIDQRFWEGTESAFYSHLHQLAERLPEQDGAFMPEDVARRWHMTLYETALELFDELSLAGDAEALDMKRIVAARNELGKRLWRNKTMKTLRTWAGMEEGVGKSKDKAAKEEA
>NZ_AP017372.2|WP_096408395.1|750875_753662_+|CRISPR-associated-helicase/endonuclease-Cas3
MESLPAYFRYWAKIPKERGFGWDACHLLPYHALDVAATGKYLLDSDEELLERFSAAVQMAPDVFRRLLVFSLALHDLGKFARSFQSLAAIDGVDLVEPDPRYVYRSRHDALALAYWKHYGQECLRNPETGNEWLDAPSELTGRQSLAFWLSVAFGHHGKPVDMEKAALDLAFSPEDKAAAWGFVEDAAALLEPSFPHAQLSDKHWRDHVLKPASWELAGFGVLADWLGSDQSVFGHRAESMPLATYWHEYALPGAEQVVERSGLRGHKEMVAFPGFSQMFGFEPAPLQSWAESVPLADGPQLFLLEDITGAGKTEAALTLAHRLLAAGHRNGVYFALPTQATSNAMYTRVGAVYRDFYSRDSQPSLVLAHGARQLRDDFTRSILPEMAPDTPYTPDDEGGLAQCSQWLADSRKKALLADVGVGTVDQALLGVLPRRHQSLRLLGLARKVLVVDEVHAYDTYTGTLLERLLEAHARHGGSAILLSATIPQSMRRRFLEAWQRGREGGQALQPASEAFPLATHLYSEGLDETPVAARTSSERDLPVDFVHSEEEALSRVVEAARSGRCACWIRNTVDDAIGAYQALRESLPEPDKALLFHARFTMGDRQRIENDALRLFGKESGNAERAGRVLIATQVVEQSLDLDFDVLVSDLAPVELLIQRAGRLYRHARTPDGDLLLSGTDQRESPVFHVHAPEWNDEPDAEWVRRALIGTSYVYPDFGMLWLTMRVLRERGAIRLPAEARLLLEAVYAPEVDVPEGLQRASDEALAEQLSHRSMAGFNVLDLSKGYSGKSVEGGWSDDEEIGTRLSDEPSVQVVLVRVDENQRVKPWNSDTAHPWAMSTVQLRKSQADRLPSLPEELGHEIELLREEVRSLRYARFWLPADERAANHAAYDSLLGAVIPRKGGEQEASTVGTVPHSGSSSNENEEH
>NZ_AP017372.2|WP_096408393.1|750180_750744_-|nucleoside-deaminase
MYIPEFNITLPGWLHEMLSGELQQLPGDEAQMRFVISLAIENIRQESGGPFAAAVFDSSGNLLAPGLNLVTSLHCSILHAEIIALALAQQRIGSHDLSDAGRSHHTLVTSAEPCAMCLGAIPWSGVSRVVFGALDADVREIGFDEGTKPDHWKEALATRGIEVRGEVLRSEAARLLQAYSEKGGPLY
>NZ_AP017372.2|WP_096408390.1|749927_750140_+|hypothetical-protein
MFVFTLAIIIMAALALLSGIAILFYSRSGNSTSSGREFSMAVFFVSALNFVSNSLVFGVVLGVNAMVGFY
>NZ_AP017372.2|WP_096408415.1|763849_764542_+|DUF4338-domain-containing-protein
MLRLHEQGKITLPPSRLRKRRRRATFPPTPATDPQPLLNTPVNMMPKPTFHIVQGNAAQSRCWNEYIARYHYLGYTPLDGHQIRYNVYAGEQLVALLGFGASAWKLADRERFIGWSSEQRERNLSLVVNNTRFLILPWVQVRGLASKILGLAARQLPLDWQQRYGFQPVLLETFVEWPRHTGTCYKAANWQWVGRTTGRGKKSTSHKQRLPTKDIWLYPLRRDFANRLCS
>NZ_AP017372.2|WP_096408418.1|764624_765014_+|type-II-toxin-antitoxin-system-VapC-family-toxin
MDIVADTNIFLAVALNEPDRDRIITLTADASALAPEILPYEIGNALSAMVKRRQLSYSEALEAEKSVRRIPVRLVSTDIRSSLQLALDQDIYAYDAYFLQCAQALSCPLLTLDRRMRQVARELGIRVLE
>NZ_AP017372.2|WP_162549345.1|765234_765834_-|hypothetical-protein
MFLNPPPNMYGFWQPTTAELPIDDWARHEFAHARCGDRRLQERLITVARDFAAHSQADTPEACGTRARTKAAYRFLANPRASMQQLIRSHAQASAGRCRHHDVVLAVQDTTTLNYSAPTITEGLGPIGSRADGAQGLIVHDTMAFSTEGTPLGLIDVYAWARHCEDRGLRRLSGDCYLPYRSNVANQPREERASAEWPC
>NZ_AP017372.2|WP_096408425.1|766204_767125_+|DUF1016-family-protein
MPRYWVIAPIDSQPADFFEKVWRFDIEKEVISIGWSQFGDVSGMSRDELAKVVAHHYPEKPQQTKGLITNMVWSFCHKIEPGDVVIARRGRKILAAVGTVREKAFYKAGKNPDVDHRLFLPVTWHQEPRDKDFGAVVFPMPTLAEIDETQYQSLVEGSGLEVAKSEDGETYENQAEFVLEKYLEEFIVSNFSGIFKGELEVYVDEDGNTGQQYTTDIGSIDILAEDRRNNSLVVIELKKGRPSDQVVGQIMRYMGWVKKNLALEDQKVRGLVICRGEDQRLSYALEMVDHVDIRYYKVSFSLTERP
>NZ_AP017372.2|WP_096408428.1|767487_767928_+|NfeD-family-protein
MISAWNIWLASAIGLLLVDLLLFGGASGVLLAMAGMALFGMGAALLGLSWEFQILSAALSGVLLIPLALKALKKLTPGELSQSLDDPRLRGQQFKVYTDSGGQARVTVFGDEFMARPSSIDQSLKDGSLVRIVRFEGNTAIVTPND
>NZ_AP017372.2|WP_096410315.1|767972_768938_+|paraslipin
MTTLLIVLLAVLLIIIIIKGLVIVPQRHAMVIERLGRYHRTLNAGLNLIIPILDQPRPITIVRYRDNQKTINTEKKIDLREVVLDFPKQEVITKDNVGVRIDGVLYYQIMDAQAAIYGAENLVLAVQTLAQTSLRSEIGRMELDQIFESRQEINARLQNTMDDAGNKWGVKVNRVEIRDIDIPDDIREAMNKQMAAERARRAEVREAEGYKQAEILKAEGDKEAAVQRAEGEKRAIQQILEAAAGTEGLEARDAMRYLIAQEYMETLPKVAQEGERVFIPLEATSLMGSVGGIRELLGPTTGAAAASSSSSSGAGSGGSGG
>NZ_AP017372.2|WP_096408430.1|769016_769352_+|transposase
MVRFGAFHQLLKLKAEEAGAWAVEAPTRQIKPSQTCHACGQQEKKPLSQRWHSCPCGTSCSRDENAARVLLAWLERSLSGREPADAWREVRPGHPLDESALPSKRETHAVA
>NZ_AP017372.2|WP_096408433.1|769400_769673_+|HigA-family-addiction-module-antidote-protein
MLVEEFLRPMQITQRELADAIHVPYQRVNELVNQKRGITPSTALRLARFFGVSADFWLNLQVRWDLYKTQQVEKDELAEIQDVTHWQKMA
>NZ_AP017372.2|WP_096408436.1|770279_771059_-|hypothetical-protein
MEVASAFVAWFYDILAFFGYTHPVHPIFVHITIGLVVAAMVFALIALVPQYNRYAITARDCVTFAFISAVPTMLVGLMDWVHYFGGHLSSLFKIKITLALILIPLLGLAVYLHSKLNIRSILLHIVYLAGFVNIVLLGYYGGELIHASATPHAETAADEDPDRDPDAVTYSQVSRIMQNQCVHCHSRHNDLGGLDLSSYDALMEGGDSGAVVEPGEPQESLLVLMLDGSEEPLMPLGGPELPQSDIDTISKWVEKGAER
>NZ_AP017372.2|WP_096408438.1|771076_771571_-|SsrA-binding-protein-SmpB
MTAVSKKAGKSKAGGGNVIAVNRKAGFDYFIEERLEAGLALEGWEVKSMREKRVNLTESYVLVRRGEAWLVGCNITPLSTASTHIRPDPTRTRKLLLHRREISRLAGSVDRAGYTVVPLQLYWKRGKAKLEIGLAKGKQKQDKRADKKEKDWQRQRERLLKHKV

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_AP017372_6

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_AP017372_6

2199793-2199897

Orphan

Consensus_repeat	Method
CCTCCAGGGATGGATTCACGGCGTCCTCCACACC	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_AP017372_6

>merge|NZ_AP017372|6|2199793-2199897|CRISPRCasFinder
CCTCCAGGGATGGATTCACGGCGTCCTCCACACCGGGGCGGGTGGTGGCGCCGGCGAAGTTTTAGAGGTGCCCTCTAGGGATGGATTCACGGCGTCCTCCACACC

>NZ_AP017372|6|5|2199793-2199897|CRISPRCasFinder
CCTCCAGGGATGGATTCACGGCGTCCTCCACACC	GGGGCGGGTGGTGGCGCCGGCGAAGTTTTAGAGGTGC
CCTCTAGGGATGGATTCACGGCGTCCTCCACACC

Protein	Signature genes	Signature genes Name	Protein_function
NZ_AP017372.2\|WP_096410004.1\|2198263_2199610_-\|HAMP-domain-containing-protein	unknown	unknown	gnl\|CDD\|236532
NZ_AP017372.2\|WP_096410011.1\|2206485_2206707_-\|Txe/YoeB-family-addiction-module-toxin	unknown	unknown	gnl\|CDD\|284238
NZ_AP017372.2\|WP_096409999.1\|2189424_2189757_+\|Hpt-domain-containing-protein	unknown	unknown	gnl\|CDD\|225108
NZ_AP017372.2\|WP_096410008.1\|2201553_2204997_-\|pyruvate-carboxylase	unknown	unknown	gnl\|CDD\|237263
NZ_AP017372.2\|WP_096409996.1\|2182155_2184612_-\|PAS-domain-S-box-protein	unknown	unknown	gnl\|CDD\|274362
NZ_AP017372.2\|WP_162549498.1\|2200642_2200795_-\|hypothetical-protein	unknown	unknown	unknown
NZ_AP017372.2\|WP_162549496.1\|2186024_2188763_-\|PAS-domain-containing-protein	unknown	unknown	gnl\|CDD\|274362
NZ_AP017372.2\|WP_096410013.1\|2207932_2209705_+\|DUF262-domain-containing-protein	unknown	unknown	gnl\|CDD\|377008
NZ_AP017372.2\|WP_096410007.1\|2200903_2201332_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|235502
NZ_AP017372.2\|WP_162549499.1\|2205139_2205304_+\|hypothetical-protein	unknown	unknown	unknown
NZ_AP017372.2\|WP_096410010.1\|2205977_2206529_-\|RNA-2',3'-cyclic-phosphodiesterase	unknown	unknown	gnl\|CDD\|274058
NZ_AP017372.2\|WP_096410000.1\|2189753_2190440_+\|response-regulator-transcription-factor	unknown	unknown	gnl\|CDD\|223816
NZ_AP017372.2\|WP_096409997.1\|2184599_2185778_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|225116
NZ_AP017372.2\|WP_096410009.1\|2205644_2205941_+\|hypothetical-protein	unknown	unknown	unknown
NZ_AP017372.2\|WP_096409995.1\|2178538_2182030_-\|PAS-domain-S-box-protein	unknown	unknown	gnl\|CDD\|182070
NZ_AP017372.2\|WP_096410012.1\|2206703_2206955_-\|type-II-toxin-antitoxin-system-prevent-host-death-family-antitoxin	unknown	unknown	gnl\|CDD\|171099
NZ_AP017372.2\|WP_109962895.1\|2190516_2194395_-\|PAS-domain-containing-protein	unknown	unknown	gnl\|CDD\|236842
NZ_AP017372.2\|WP_162549497.1\|2197968_2198124_-\|hypothetical-protein	unknown	unknown	unknown
NZ_AP017372.2\|WP_096410003.1\|2194859_2197997_+\|PAS-domain-S-box-protein	unknown	unknown	gnl\|CDD\|274362
NZ_AP017372.2\|WP_096410006.1\|2199927_2200668_-\|response-regulator-transcription-factor	unknown	unknown	gnl\|CDD\|223816

Protein	Function_ID	Function_description	E-value
NZ_AP017372.2\|WP_096410004.1\|2198263_2199610_-\|HAMP-domain-containing-protein	gnl\|CDD\|236532	PRK09470, cpxA, envelope stress sensor histidine kinase CpxA.	5.63282e-78
NZ_AP017372.2\|WP_096410011.1\|2206485_2206707_-\|Txe/YoeB-family-addiction-module-toxin	gnl\|CDD\|284238	pfam06769, YoeB_toxin, YoeB-like toxin of bacterial type II toxin-antitoxin system. YoeB_toxin is a family of bacterial toxins that forms one component of the type II toxin-antitoxin system in E. coli whose antitoxin is represented by YefM, found in pfam02604. The plasmid encoded Axe-Txe proteins in Enterococcus faecium act as an antitoxin-toxin pair. When the plasmid is lost, the antitoxin is degraded relatively quickly by host enzymes. This allows the toxin to interact with its intracellular target, thus killing the cell or impeding cell growth. These toxins are highly potent protein synthesis inhibitors, specifically blocking the initiation of translation. In the case of YoeB, it binds to the 50 S ribosomal subunit in 70 S ribosomes and interacts with the A site leading to mRNA cleavage at this site. As a result, the 3'-end portion of the mRNA is released from ribosomes, and translation initiation is effectively inhibited.	3.765e-26
NZ_AP017372.2\|WP_096409999.1\|2189424_2189757_+\|Hpt-domain-containing-protein	gnl\|CDD\|225108	COG2198, ArcB, FOG: HPt domain [Signal transduction mechanisms].	0.000836046
NZ_AP017372.2\|WP_096410008.1\|2201553_2204997_-\|pyruvate-carboxylase	gnl\|CDD\|237263	PRK12999, PRK12999, pyruvate carboxylase; Reviewed.	0
NZ_AP017372.2\|WP_096409996.1\|2182155_2184612_-\|PAS-domain-S-box-protein	gnl\|CDD\|274362	TIGR02956, sensor_protein_TorS, TMAO reductase sytem sensor TorS. This protein, TorS, is part of a regulatory system for the torCAD operon that encodes the pterin molybdenum cofactor-containing enzyme trimethylamine-N-oxide (TMAO) reductase (TorA), a cognate chaperone (TorD), and a penta-haem cytochrome (TorC). TorS works together with the inducer-binding protein TorT and the response regulator TorR. TorS contains histidine kinase ATPase (pfam02518), HAMP (pfam00672), phosphoacceptor (pfam00512), and phosphotransfer (pfam01627) domains and a response regulator receiver domain (pfam00072). [Signal transduction, Two-component systems].	2.12016e-78
NZ_AP017372.2\|WP_162549496.1\|2186024_2188763_-\|PAS-domain-containing-protein	gnl\|CDD\|274362	TIGR02956, sensor_protein_TorS, TMAO reductase sytem sensor TorS. This protein, TorS, is part of a regulatory system for the torCAD operon that encodes the pterin molybdenum cofactor-containing enzyme trimethylamine-N-oxide (TMAO) reductase (TorA), a cognate chaperone (TorD), and a penta-haem cytochrome (TorC). TorS works together with the inducer-binding protein TorT and the response regulator TorR. TorS contains histidine kinase ATPase (pfam02518), HAMP (pfam00672), phosphoacceptor (pfam00512), and phosphotransfer (pfam01627) domains and a response regulator receiver domain (pfam00072). [Signal transduction, Two-component systems].	3.59904e-73
NZ_AP017372.2\|WP_096410007.1\|2200903_2201332_-\|hypothetical-protein	gnl\|CDD\|235502	PRK05560, PRK05560, DNA gyrase subunit A; Validated.	0.00968251
NZ_AP017372.2\|WP_096410010.1\|2205977_2206529_-\|RNA-2',3'-cyclic-phosphodiesterase	gnl\|CDD\|274058	TIGR02258, UPF0097_protein_AF_2157, 2'-5' RNA ligase. This protein family consists of bacterial and archaeal proteins with two tandem copies of Pfam domain pfam02834. Members for which activity has been measured perform a reversible, ATP-independent 2'-5'-ligation of what is presumably a non-phyiological substrate: half-tRNA splice intermediates from an intron-containing yeast tRNA. The physiological substrate(s) in prokaryotes may include small 2'-5'-link-containing oligonucleotides, perhaps with regulatory or biosynthetic roles. [Transcription, RNA processing].	8.15736e-46
NZ_AP017372.2\|WP_096410000.1\|2189753_2190440_+\|response-regulator-transcription-factor	gnl\|CDD\|223816	COG0745, OmpR, Response regulators consisting of a CheY-like receiver domain and a winged-helix DNA-binding domain [Signal transduction mechanisms / Transcription].	2.05374e-54
NZ_AP017372.2\|WP_096409997.1\|2184599_2185778_-\|hypothetical-protein	gnl\|CDD\|225116	COG2206, COG2206, c-di-GMP phosphodiesterase class II (HD-GYP domain) [Signal transduction mechanisms].	4.28445e-30
NZ_AP017372.2\|WP_096409995.1\|2178538_2182030_-\|PAS-domain-S-box-protein	gnl\|CDD\|182070	PRK09776, PRK09776, putative diguanylate cyclase; Provisional.	1.34625e-25
NZ_AP017372.2\|WP_096410012.1\|2206703_2206955_-\|type-II-toxin-antitoxin-system-prevent-host-death-family-antitoxin	gnl\|CDD\|171099	PRK11409, PRK11409, YoeB-YefM toxin-antitoxin system antitoxin YefM.	6.79792e-28
NZ_AP017372.2\|WP_109962895.1\|2190516_2194395_-\|PAS-domain-containing-protein	gnl\|CDD\|236842	PRK11091, PRK11091, aerobic respiration control sensor protein ArcB; Provisional.	4.43991e-81
NZ_AP017372.2\|WP_096410013.1\|2207932_2209705_+\|DUF262-domain-containing-protein	gnl\|CDD\|377008	pfam03235, DUF262, Protein of unknown function DUF262.	3.45966e-22
NZ_AP017372.2\|WP_096410003.1\|2194859_2197997_+\|PAS-domain-S-box-protein	gnl\|CDD\|274362	TIGR02956, sensor_protein_TorS, TMAO reductase sytem sensor TorS. This protein, TorS, is part of a regulatory system for the torCAD operon that encodes the pterin molybdenum cofactor-containing enzyme trimethylamine-N-oxide (TMAO) reductase (TorA), a cognate chaperone (TorD), and a penta-haem cytochrome (TorC). TorS works together with the inducer-binding protein TorT and the response regulator TorR. TorS contains histidine kinase ATPase (pfam02518), HAMP (pfam00672), phosphoacceptor (pfam00512), and phosphotransfer (pfam01627) domains and a response regulator receiver domain (pfam00072). [Signal transduction, Two-component systems].	1.85479e-81
NZ_AP017372.2\|WP_096410006.1\|2199927_2200668_-\|response-regulator-transcription-factor	gnl\|CDD\|223816	COG0745, OmpR, Response regulators consisting of a CheY-like receiver domain and a winged-helix DNA-binding domain [Signal transduction mechanisms / Transcription].	2.94541e-80

>NZ_AP017372.2|WP_096410004.1|2198263_2199610_-|HAMP-domain-containing-protein
MGSLFLKLFLWLWLTGIIIAGAFVVSWHHWAPASSLPSQAELEQVAEEISNLYAEEGGWGAVHGYLRSLSRDQKLRFVLLGQDELATRGMQRRMLRGLSQQDREILLDTAEDRGRLNGMLYKRVVVDFAGAHDFYLIALHPVEGLGGLPVWLRAVIALAVTGGLAGGLAAYLSRPLRRLRRASQALASGDLHARVPVVERGGDEIAALGRDFNAMAERLESLVEAQNRLLRDISHELRSPLSRLQVALELARRETSGDSNALAKMENDIERMDQLIGQLLTLARLESGAGASNMESVDLHELIGQVCEDAQFEAQASGCNVLKEDGPHLQITGDRHLLRSALENVLRNALRYTPAGGVINVAWQRDQDGIWVSVIDSGPGVSEERLNDLFEPFVRLSAARERDSGSCGLGLAIVRRAVQAHGGSVAAHNRPQGGLEVRFWLPLKGPAS
>NZ_AP017372.2|WP_162549497.1|2197968_2198124_-|hypothetical-protein
MNPSLEASWRHPWRQDLHTGADGGAGEVFRGSPVLVMFSPFGVISACALPN
>NZ_AP017372.2|WP_096410003.1|2194859_2197997_+|PAS-domain-S-box-protein
MGRDKVEQRTSDFSQNLLDKLPVAVCSLDSAGCFTYLNTAACQLLGYPDESALLGVNFSAVIDAERTPLPADTVTERLVAATDEPLCADTTLWLQPRVGAALPVEVEVAALRSAETAAGEVAVTLRECRTVQDITEQRARERFQQQLVAILDSTSDLVTLHGSDGSLIYINEALRARFGLQQLPSCPSVEEAIRRRHPPWAADLLLNEGLPTARREGLWQGQTAFLDADGQEIPASQVIIGHRDSSGEVVQLSTIIRDISDLKRTQQEAVESEQRFRLIAEHTRDVFWLRSEQKALYVNPAYERIWGQTREHFYANPNSFLESVHPEDRKEVETAINQAIAAGEEINIRYRIVRPDGDVRWMEARSSPFKISGTEETLRAGVARDVTDEALAMRRLEQLVAILDNTSDIVALHGEDGTLLYLNAAGRAKAGIDNQAVDGMLGIADDGSMPPLSLEEAISRFHPPWAADLLLNEGLPTVRREGLWQGETAILKADGTQAPTSQVLIGHRNSYGELTYISTILRDISDQKKAQQEVAESERRFRLIAENIRDAFWLRTDAQTLYVNPAYERIWGQPVESFYANPKAFLESIHPEDRYGVEKALDQAISEREEFNALFRIIRSNSEVRWIQMHSLPVPGRESEGMRAGIARDVTEREQALIQLREANRTKSEFLNAVSHDLRTPLNAIIGFTDLLADSELDAHQREQVKLCQAAGRTLLGLIDTLLDLSRLKAGRMTLQKEAFLLRKFLAERMPMLSQQAEDKGLNLQCSVDNGLPDRLQGDTTRLSQVLFNLVSNAIKFTDSGYVRVHFSRYDSKRLQVSVQDNGPGIPDEFQERIFEPFDRGTDAIKHLQGSGLGLAISRQLVNLMGGEIWLHSTPGQGSTFFFTAELPEDESEPAVDPAQTAPESANGAPADRENVAGTRVLVAEDEPTNILLIQALLERCGAEATVAENGQEALDIWQQAEQEFDLILLDMQMPILDGAQTVKSLREAEVAQNRVYTPVAMLSAHASTEVREQCLQSGADTYMTKPVRLDSLTDLLSWAKRRQR
>NZ_AP017372.2|WP_109962895.1|2190516_2194395_-|PAS-domain-containing-protein
MENKKGSKCGCLSAKCKLDLLQQVSGIGFWEYDLCTGQVNADAQCQSLYGYDNSESERSLATDYALWREHVHPEDLSWVEEEVQAAIANGQPWRFTYRIYRSDGQLCWLHSSGHVERDDQGEPCLLIGFEQDVTAQKLQEQALEQAHERLQRAEEIVSLGHWISYPATGELIWSPMTYQLCGFPAEAEPPGWEEFIARIPEQDRHQVAEYQLQSKADTDQSQGEYRIVHPNGRVVWVREIANRWQDENGRWIIQGTIQDITEQREALERSEARRQRLEAILETIPDVALTETDLEGTIREASRSAERIFGYSREELLGSDICMLHDPAEHARVREGIARLQRTAQGYSVECELIRGTGERFQAQLSVAPLLNERGEVVGKIGACIDLSAQFADEQRLRMAQEAAGFGVWDWDLAADQVYWDEACWRMLGYDPEQQSILTFADWQKFVHPEDLERVQPIVESHLAAGSPFTIELRYRCADGSWLWVQGRGQTLRRGADGSPTYMVGTHVDVQTLKETEFALRRSELELTEAKRIARLGHWLYDIKSGDVHWSSEIYEIIGLEPAETAMDWDTFLSRVPPEDHPELYEAIERTLNRGDPYELEHHLMSVDGGRRIVQARGYAEFDAAGNPQLLRGTAQDVTEQRVLQRELAEREAHYRDLVENQPLMIERFLPDTTVTYANPALGDCLGVEPEALIGQRWLDYLPAEERENIEAHLAGFTPSHPVSQFENSMPGKNGMQLWTMWTNRAFFDEKGELSHFQSVGVDITERRRAEQAEQQLREQLETRQKELEAIFAAARSVSLIKTDLNSVIEEASTGAEVLFGYSREELIGRHVSLLHTAEDIERLADYVERLFKDHEPIRMETDLVHRDGSRFPALFTVHPITDKHGELVATLGVSLDMSAQKRVEQELADTIRAKDTFLSAVSHDLRTPLNALMGFLELLDDPQLSAEQRSEYMEQCRQGAQRLLGLIETLLDLARLEAGRLELRPRATELPALIDNQVAMLRSRACEKGLSLDYSIAEAVPRWVEVDDTRLGQLLSNLLSNAVKYTQQGGVELEVRTVDNTRVSFAVHDTGPGLTEQQQKEIFTAFDRGGYRGTSQGYGLGLAIVSELINLLDGELSLSSTPGQGSTFAFTIPLPRASEPSPEGESSIAAGESDAEPTASSARRPLNILVADDEPANVMLAQALLLKLGCEVVCAQSGTEALAAWQAEDFDMLLLDLKMPDLDGDQVARNVRAEEHEQGRQPTRIVLCTAYAYSEVESLINESGCDAYLGKPLDRSALSSLLDWVASSYAK
>NZ_AP017372.2|WP_096410000.1|2189753_2190440_+|response-regulator-transcription-factor
MKPPHILLIEDERSSRSICLNALLRAEYQATVALTAREGLRLLRSTHFDLVLLDLNLPDADGLSLASTLHGSHPELPIIMMTVRTAAEQRAAGLEAGAVDYLSKPFHQTELIHRVRRALAAGPPTPATQITFGPWLLEVEQRSLHHAEGFELELTLGEARLIEFLLRARGRPVNRDQLAEAVARSREGNPKSVDVLVSRLRRKLEDKTRGLRHIVAVPGLGYRIEVGE
>NZ_AP017372.2|WP_096409999.1|2189424_2189757_+|Hpt-domain-containing-protein
MEIIDIDSALERLDGDRELCRELLLDFYIDYYEVDRILRDRLRDGATEDARQLLHNLRGAAGNLGMGRLETVAKTLSQQIRLGAVEVSALNNFSEALHRVLSELEHTKRL
>NZ_AP017372.2|WP_162549496.1|2186024_2188763_-|PAS-domain-containing-protein
MATLNVNEEYPGESLDVALCRFRPDTTLTFVNAAYARLFGGGSGSLLGQRWIEWVPVSARPRVWSVLAQLGPAAPFQTYTHEVCLVDGGVMPYQWTDVALFGPDLEVTEIQSVGHPVDGGCSSDATAAEAATCYSGGEQLLVESEWRARIISEAMEEVVWLRAGDQMLYVNSSYERIWGRSIEELMANPDSFLDAVHPGDRERIICSWAACKAGDVRFDETYRIVRPDGEVRWVHAVNSAPFASAGYTACSVGSARDVTAQIEIEQALYQANHDLRVAEQIARLGHWISDLHEGTLTWSPVTFQLCGFDVSRSPPDFDAFLERVHPEDRPKVAESQLAREPQRERTEAEYRIIHTDGRVVWVRELAQRDKGEEGQPILRGTIQDITAMKEAQATARQRQEELEGIFKAATSVGLVKTDLASSVIDVSAGAEQLFGYSREELIGQPVNCLHITEDQADLAKWVGHLVCEQRELNFETRLMRKSGESFPARLFIHPIQDEHGSVVATLGVTFDISDLKAVQQQLEDASRIKTTFLRAVSHDLRTPLNALISYVELLGNADLSREQRQNFVKRCQEAGERQAQLIDSLLDIARLQSGNIQLKRVPMELHQLLEEQCRLLLQRAQEEGLTLEWSIAEDVPGWVIGDPTRLVQVLSNLVENAIKYTDRGRVCVEVQAEGGELVGFAVKDSGPGLSEAQQQTMFNAFDRLGYDGPVAGSGLGLAIAKELAHRLGDGLWVESAPGQGSTFGFTAHLPPCAPAQKVEDKIEEQLPESNSLGQSLRVLVAEDEQTSAVVVPLRLQRLGCEVTLVKRGDAALEAARQGVFDLLLLDLSMPGLNGIEVARVLRSEEDARPGVRRVPKVLCTAYSREEIEQEFDLVEVDALLEKPIREKHLRQLISRVRLGLDPAEAGGRPYGV
>NZ_AP017372.2|WP_096409997.1|2184599_2185778_-|hypothetical-protein
MRAGYEDSPAILGLGANIQVGDRLTFDVYDEEGRLLMRRGKQILSQNQLRRIFHDGRVELSGRSLSKLGHSRFTHPGGPAVRRGNPVQEDLSPHERLHACAQALQRNYERIRAGERDFLPRLRQVVERLQRLIDLDTDAALGVAHLSRAYPEHILQPLRQAIVADIVARAAGCCEGYRNSLIGAALSADIGMLELRAVLDQQSTDISQAQRKALVEHPERSAQILREAGLDDDNWLRAVMEHHERLDGSGYPRGIRGDSVCDIAGLLMVANVYMAMVTPRAHRSARPPKEVLRELFCEADHLYPAHYAQYIVRELGIYPPGTVVELETGDVGVVTRRAGKWARPWFYSLQRAAGRRLRAFECNLTEEDLEIVRSYRPEDIKVPIPECAPWGY
>NZ_AP017372.2|WP_096409996.1|2182155_2184612_-|PAS-domain-S-box-protein
MGLLKGTLAYADWLWVQGRGQTLRRGADGSPTYMVGTHVDVQTLKETEFALRRSELELTEAKRIARLGHWLYDIKSGDVHWSSEIYEIIGLEPAATAMDWDTFLSRVPPEDHPELYEAIERTLNRGDPYELEHHLMSVDGGRRIVQARGYAEFDAAGNPQLLRGTAQDVTEQRVLQRELAEREAHYRDLVENQPLMIERFLPDTTITYANPALAAYVQTEPDRLIGQRWIDLFPVDEQKRAQAHLTSLTPQQPVGRLENSLTGADGLRYWILWTNRAFFDDSGTLSHFQAVGVDITARRRAEQAEQQLREQLETRQKELEAIFAAARSVSLIKTDRDTVIQEVSCGTEALFGYSRSELIGQHVSMLHVQEHVEARQLDQSSLPIRLETKMRRRDGTTFMAHLAVHPILDADDQIIAALGVSFDISDQKRVEQELADAIRAKDTFLSAVSHDLRTPLNALMGFLELLDDPQLSPEQRSEYMEQCRQGAQRLLGLIETLLDLARLEAGRLELRPRATELPALIDNQVAMLRSRACEKGLSLDYSIAEAVPRWVEVDDTRLGQLLSNLLSNAVKYTQQGGVDLEVCAVDDTRVSFAVHDTGPGLSEQQQKEIFTAFDRGGYRGTSQGYGLGLAIVSEFINLLDGELSLSSTPGQGSTFAFTIPLPRASEPSPEGESSIAAGESDAEPTASSARRPLNVLVADDEPANVMLAQALLIKLGCEVVCAQSGTEALAAWQAEDFDMLLLDLKMPDLDGDQVARSVRAEEHEQGRQPTRIALCTAYAYSEVESLISESGCDAYLGKPLDRSALSSLLDWVASGLQR
>NZ_AP017372.2|WP_096409995.1|2178538_2182030_-|PAS-domain-S-box-protein
MGPPPFARIAALLAVSLSGVFCGAGVLSLAEYGGMTQEGGGMDGSSAKPNKLTAGFLHQLLDSQAVAVCALDSGGRFTYLNPAACRRLGHSDDTALLGERFDTVIDTERAEPSAAALTEQLTAVAVTGEPLSIYSVLWLHPCARTSFPVIIEASPLNSDETEERGVVVTFRDATVQHHALNQALQRAEQAERIGAIGHWIHYPESGQLIWSLMTYELFGFDPDGSKPDWGAFIARVPEADRGQIAESQFKADPSRRSCEGEYRIVHPGGRTLWVREIAQRLKDENGQSIIQGTIQDITKQRKALERSEAQRQRLAAILRTVPDVALIETDLEGKVSELNRSAELMFGYSREAFLGSDIYMLHDPAEHAQVREGIARLQRTAQGYSVECELIRGTGERFRAQLSVAPLLNERGEVVGKIGACIDLSAQFAREQRLRMAQEAAGFGVWEWDVETDRAHWDEASWRMLGYDPEQQGTLTYAQWQALVHPEDLERILPEFEHHLAAGTPFTIEFRYRCADGSWLWVQNRGQTLRRAADGSPIYMVGTHVEIQQLKETERALAKSEQRFRDVTLAAGEYIWEIDPEGRYTFITSPAEPLLGRPVEAIIGCSVFDFMPDDEAERVHGLLQAWADERSAWRDLEHVSLRPDGSLVHQRVSGLPILDEDGNLTGFRGTGRDITAEKEAERAQKRLTERLRLATSAAELGIWEYDLKSGRLECDECMCRLYGIDPATFGHASEGWVEAPESKSLDTTVFGNTFEDWAETLLPDSRDSTVAALNEAVASRTPFDIQMEIRRADDGSCRTLHGHAQVICDASGIPVRIVGISRDITAEQEYRRQLAAAKERFAGIFEQTGSGVAVYRPVDEGRDFECIEINPASERLDQITRDEVIGRRLTDCFPGVVEMGLLAALQRVARTGVPEELPLASYQDKRITAWRENRIFRLSSGEVVAVYDDRTEIKQAQQESERARKQLANLTAQLPGFIYQYRLWPDGRHAFVYANGRAEQIYGVTPEQAIEYPDHLFEVIYEADRGEFYRSIERSAQALTPWYQTFRIHHSSKGTAWLEGNSMPERLADGSTLWHGYIHDITDRVRAEQELAQSKARLEEFFNQSISGFFFMMLDEPIDWQGATEEQKEALLDYALTHVVGCQNPYIFGGGFKNKHIYWVVKS
>NZ_AP017372.2|WP_096410006.1|2199927_2200668_-|response-regulator-transcription-factor
MTRILLVDDDQELTAMLSDYLTGDGFEVVTAYDGQKALEKVDTAGPDIIVLDIMLPVYDGFEVLRRLRQSHHDQPVLMLTARGDDVDTVVGLELGADDYLPKPCNPRVLVARLRALLRRTQSEVASSAEQLQVGDLCLDLGQRRATLRGCESAAITPLELTDAELDLLACLLRRVGQAVDKDKLSREALNRPLTPYDRSIDWHISNLRRKLGPFDDGSERIKTVRGVGYQYVSGKGTYKHSPGASL
>NZ_AP017372.2|WP_162549498.1|2200642_2200795_-|hypothetical-protein
MNPSLEASWRHPWRQDLYTGATTGQLSGSGRAFEVPITRKSKFDPDSACR
>NZ_AP017372.2|WP_096410007.1|2200903_2201332_-|hypothetical-protein
MRKQILSTGILCLTAALFSPSVLASDSKGELEQSWERGAMQERIIQRLDLSDEQRDKLLEIRNRHLDKMHEEMKEVLTGEQLEKFLDLRESAEQRLRQGGGGDWRGDSRSGSNNRSDSGRGEFGRGESGRGEPGRDGSGRGN
>NZ_AP017372.2|WP_096410008.1|2201553_2204997_-|pyruvate-carboxylase
MAQFHKILIANRGEIAIRVMRAANELGKRTVAVYAQEDKLGLHRFKADEAYQIGEGMGPVEAYLSIDEIIRVAKMAGADAVHPGYGLLSENPRLVDACERAGITFIGPRAETMRALGDKASARHVAIAAGVPVIPASEVLGEDMAAARRWADEIGYPLMLKASWGGGGRGMRPILGPEELEAKVLEGRREAEAAFGSGEGYLEKVIERARHVEVQVLGDTHGGLYHLYERDCTVQRRNQKVVERAPAPYLTPEQRAEVCELGLKVARHVDYQNAGTVEFLMDMDTGSFYFIEVNPRIQVEHTVTEEVTGIDIVKAQIRISEGEHLDAATGKADQGEIWLNGHAMQCRVTTEDPQNNFIPDYGRITAYRSATGMGIRLDGGTAYAGGVITRYYDSLLVKVTAWAPTPTEAISRMDRALREFRIRGVSTNIPFVENLIKHPVFLDNTYTTKFIDTTPELFEFDKRRDRATRLLTYLAEITVNGHPEVIDRPRPAAGIPLPTPPKAQGEPLPGTRNLLEEQGPQGLVDWLAGRKELLLTDTTMRDAHQSLLATRMRTFDMVRVAPAYAANLPQLFSVECWGGATFDVAYRFLQECPWQRLRQIREAMPNVMTQMLLRGSNGVGYTNYPDNVVRAFVHQAAASGVDIFRVFDSLNWVENMREAMDAVLETGKVCEGTICYTGDILDPGRAKYDLKYYVKMGKELRDAGAHMLGVKDMAGLLKPEAARVLFPALKEEVGLPIHFHTHDTSGIAGATILAAADVGVDVADVAMDSFSGNTSQPVFGSIVEALRHTERDTGFDMENVRAISNYWEQVRAHYAAFETGQQSPSSEVYLHEMPGGQFTNLKAQARSLGLEERWHEVAQAYADANQIFGDIVKVTPSSKVVGDMALMMVSQGITREQVEDPAVDVNFPDSVIDMLRGNLGQPPGGWPQGIQQKVLKGEQPLQDRPGKYLEPLDLEEARQQASEALDGAEIDDEDLNGYLMYPKVFTEYMRRSQRYGPVSALPTRNFFYGMEPGEEISVDIEYGKTLEIRLMTVSEPGDDGNRRVFFELNGQPRTVHVADSKAKAQVVQTPKAESDNPAHVGAPTPGVVAAVAATPGQRVKAGDLLLTIEAMKMEMGLHAERDGEIKAVHVQPGSQIEAKDLLIEFAE
>NZ_AP017372.2|WP_162549499.1|2205139_2205304_+|hypothetical-protein
MNPSLEASWRHPWRHEASTPGRMVAPAKLLEAPCKHHPAKQVTHRFFHSFCGQL
>NZ_AP017372.2|WP_096410009.1|2205644_2205941_+|hypothetical-protein
MSFQWRTYTFETPWEALVGAWAEISDINNLQISTVRSLATDCDAATRHISQEDANDSLPRIYDVGTHAEEQEVPFDPDDHITALMEAAERALHELGEA
>NZ_AP017372.2|WP_096410010.1|2205977_2206529_-|RNA-2',3'-cyclic-phosphodiesterase
MDRRQRLFFALWPDDDLRSAICSRVPSGHGGRPVARDNLHLTLAFIGAADTAYAECLAEAAQAVRFEPFAFELQGLGCFGNGKVLWLGNVKPREPLERLAQDLSAVLQPCGFEPEARPFCPHVTVVRKPKAPLNLGPIEPVLWEVERFCLVSSIPAQGGVKYEVVRSYCAAKDHARSGTGDLP
>NZ_AP017372.2|WP_096410011.1|2206485_2206707_-|Txe/YoeB-family-addiction-module-toxin
MKLIFSENAWEDYLYWQKTDKKILNRINRLIKEIKREPFEGVGKPEPLKHSSTARRVNPYGSASTPLLRAVAR
>NZ_AP017372.2|WP_096410012.1|2206703_2206955_-|type-II-toxin-antitoxin-system-prevent-host-death-family-antitoxin
MDAISYTAARANLAKTMEQVCEDHSPVIITRSKSQSVVMISLEDYEALQETAYLLRAPKNARRLLESVVELEQGGGQEKALFE
>NZ_AP017372.2|WP_096410013.1|2207932_2209705_+|DUF262-domain-containing-protein
MDTRGDENSALQVKVQSFEELTAAGRELKLDDYQRGFVWDEQRVRQLIDDLAEFANQQLSNSKATQPAYAYYMGTVLLSRESEQPGERGNSAYVIDGQQRLAALSLLWSAAQEGSEVPPAMAFSYRDSRSQAQLQAAYKTIMTGLDRTGLKATHRTRELFKDVELFRHITLTVVTTGSIDEAFTFFDSQNSRGVPLHTTDLLKAHHLRAIRNHAPHQSSQAEPIQRDSARRWEGMQQASNEKNSPAGEDPVHRLFNYYLWRARNWFGPLSQRPLYPSRKALQKTFKQNAYPPRELENRLRGRPPEAVNGAEGNKLAEGGIDRVACFPCTARVHHSVVKWEPHQKEWDMEVSLPSLGTAPHNLPFTLRQPIAEGAGFFLYAQRYERLLAHMETPPQVEHVPGQRSGDDWTDFRHLYQKVVLELSHYLRQAFLLASMLYIDRFGTCRLYEFALWLEYILGAERLIKASIFQSSSRSVLERNDAGSESIGNLLDFIAVNEIPDPVIRALQEDRAADKALEKALQDNISEGSFTFGEHSVRDRYIKAVSRYFNQADKDRDKEKLPENDQERRDWILERRNWITDMLRSGGINHG

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_AP017372_7

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_AP017372_7

2237053-2237231

Orphan

Consensus_repeat	Method
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	CRISPRCasFinder

2 spacers

WYL

The CRISPR arrays of NZ_AP017372_7

>merge|NZ_AP017372|7|2237053-2237231|CRISPRCasFinder
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGACTAGTTGTTGTTGCTATTCTTGAAGACCAATCCATTGTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGACCTTCCTCTTTTTGACTTTCTAGGCGAGCGCGTGTAAGTCTGAATCCGGCCCTGCTTGGGAAGGGAACAAGAC

>NZ_AP017372|7|6|2237053-2237231|CRISPRCasFinder
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	TAGTTGTTGTTGCTATTCTTGAAGACCAATCCATT
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	CTTCCTCTTTTTGACTTTCTAGGCGAGCGCGTGTAA
GTCTGAATCCGGCCCTGCTTGGGAAGGGAACAAGAC

Protein	Signature genes	Signature genes Name	Protein_function
NZ_AP017372.2\|WP_096410026.1\|2226023_2227760_+\|hypothetical-protein	unknown	unknown	unknown
NZ_AP017372.2\|WP_162549502.1\|2235494_2235935_-\|DUF488-domain-containing-protein	unknown	unknown	gnl\|CDD\|377317
NZ_AP017372.2\|WP_109962896.1\|2230107_2233065_-\|BREX-system-P-loop-protein-BrxC	unknown	unknown	gnl\|CDD\|380283
NZ_AP017372.2\|WP_096410046.1\|2249040_2249862_+\|type-IV-toxin-antitoxin-system-AbiEi-family-antitoxin	unknown	unknown	gnl\|CDD\|371541
NZ_AP017372.2\|WP_096410043.1\|2245602_2246307_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|227186
NZ_AP017372.2\|WP_109962898.1\|2244148_2244493_+\|IS1634-family-transposase	unknown	unknown	gnl\|CDD\|227708
NZ_AP017372.2\|WP_096410039.1\|2242497_2243277_-\|hypothetical-protein	unknown	unknown	unknown
NZ_AP017372.2\|WP_096410042.1\|2244945_2245599_+\|MarR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|378956
NZ_AP017372.2\|WP_096410032.1\|2236023_2236422_-\|YjbQ-family-protein	unknown	unknown	gnl\|CDD\|223509
NZ_AP017372.2\|WP_162549501.1\|2228118_2230128_+\|IS4-family-transposase	unknown	unknown	gnl\|CDD\|372975
NZ_AP017372.2\|WP_096410036.1\|2240280_2241786_+\|DUF2779-domain-containing-protein	unknown	unknown	gnl\|CDD\|371365
NZ_AP017372.2\|WP_162549503.1\|2239331_2240291_+\|hypothetical-protein	unknown	unknown	unknown
NZ_AP017372.2\|WP_096410025.1\|2224733_2225732_-\|WYL-domain-containing-protein	WYL	pfam13280_WYL_CAS-I:CAS-III	gnl\|CDD\|379100
NZ_AP017372.2\|WP_096410033.1\|2237968_2238214_-\|class-I-SAM-dependent-methyltransferase	unknown	unknown	gnl\|CDD\|379312
NZ_AP017372.2\|WP_096410037.1\|2241823_2242126_-\|hypothetical-protein	unknown	unknown	unknown
NZ_AP017372.2\|WP_096410028.1\|2233080_2233653_-\|DUF1788-domain-containing-protein	unknown	unknown	gnl\|CDD\|378040
NZ_AP017372.2\|WP_096410024.1\|2223766_2224438_-\|SOS-response-associated-peptidase	unknown	unknown	gnl\|CDD\|376837
NZ_AP017372.2\|WP_096410029.1\|2233633_2234419_-\|DUF1819-family-protein	unknown	unknown	gnl\|CDD\|378066
NZ_AP017372.2\|WP_096410030.1\|2234415_2234907_-\|BrxE-family-protein	unknown	unknown	gnl\|CDD\|380289
NZ_AP017372.2\|WP_096410044.1\|2246306_2247005_+\|SpoIIE-family-protein-phosphatase	unknown	unknown	gnl\|CDD\|223704

Protein	Function_ID	Function_description	E-value
NZ_AP017372.2\|WP_162549502.1\|2235494_2235935_-\|DUF488-domain-containing-protein	gnl\|CDD\|377317	pfam04343, DUF488, Protein of unknown function, DUF488. This family includes several proteins of uncharacterized function.	2.65269e-23
NZ_AP017372.2\|WP_109962896.1\|2230107_2233065_-\|BREX-system-P-loop-protein-BrxC	gnl\|CDD\|380283	NF033441, BREX_BrxC, BREX system P-loop protein BrxC. BrxC is a P-loop-containing protein, and probable ATPase, from BREX (bacteriophage exclusion) systems of type 1.	0
NZ_AP017372.2\|WP_096410046.1\|2249040_2249862_+\|type-IV-toxin-antitoxin-system-AbiEi-family-antitoxin	gnl\|CDD\|371541	pfam11459, AbiEi_3, Transcriptional regulator, AbiEi antitoxin, Type IV TA system. AbiEi_3 is the cognate antitoxin of the type IV toxin-antitoxin 'innate immunity' bacterial abortive infection (Abi) system that protects bacteria from the spread of a phage infection. The Abi system is activated upon infection with phage to abort the cell thus preventing the spread of phage through viral replication. There are some 20 or more Abis, and they are predominantly plasmid-encoded lactococcal systems. TA, toxin-antitoxin, systems on plasmids function by killing cells that lose the plasmid upon division. AbiE phage resistance systems function as novel Type IV TAs and are widespread in bacteria and archaea. The cognate antitoxin is pfam13338.	2.97259e-54
NZ_AP017372.2\|WP_096410043.1\|2245602_2246307_+\|hypothetical-protein	gnl\|CDD\|227186	COG4849, COG4849, Predicted nucleotidyltransferase [General function prediction only].	3.24266e-06
NZ_AP017372.2\|WP_109962898.1\|2244148_2244493_+\|IS1634-family-transposase	gnl\|CDD\|227708	COG5421, COG5421, Transposase [DNA replication, recombination, and repair].	3.39282e-11
NZ_AP017372.2\|WP_096410032.1\|2236023_2236422_-\|YjbQ-family-protein	gnl\|CDD\|223509	COG0432, COG0432, Uncharacterized conserved protein [Function unknown].	3.09365e-50
NZ_AP017372.2\|WP_162549501.1\|2228118_2230128_+\|IS4-family-transposase	gnl\|CDD\|372975	pfam14236, DUF4338, Domain of unknown function (DUF4338). This family of proteins is functionally uncharacterized. This family of proteins is found in bacteria. Proteins in this family are typically between 206 and 475 amino acids in length.	1.83016e-55
NZ_AP017372.2\|WP_096410036.1\|2240280_2241786_+\|DUF2779-domain-containing-protein	gnl\|CDD\|371365	pfam11074, DUF2779, Domain of unknown function(DUF2779). This domain is conserved in bacteria. The function is not known.	1.03658e-47
NZ_AP017372.2\|WP_096410025.1\|2224733_2225732_-\|WYL-domain-containing-protein	gnl\|CDD\|379100	pfam13280, WYL, WYL domain. WYL is a Sm-like SH3 beta-barrel fold containing domain. It is a member of the WYL-like superfamily, named for three conserved amino acids found in a subset of the superfamily. However, these residues are not strongly conserved throughout the family. Rather, the conservation pattern includes four basic residues and a position often occupied by a cysteine, which are predicted to line a ligand-binding groove typical of the Sm-like SH3 beta-barrels. A WYL domain protein (sll7009) is a negative regulator of the I-D CRISPR-Cas system in Synechocystis sp. It is predicted to be a ligand-sensing domain that could bind negatively charged ligands, such as nucleotides or nucleic acid fragments, to regulate CRISPR-Cas and other defense systems such as the abortive infection AbiG system.	1.03783e-35
NZ_AP017372.2\|WP_096410033.1\|2237968_2238214_-\|class-I-SAM-dependent-methyltransferase	gnl\|CDD\|379312	pfam13649, Methyltransf_25, Methyltransferase domain. This family appears to be a methyltransferase domain.	2.39277e-07
NZ_AP017372.2\|WP_096410042.1\|2244945_2245599_+\|MarR-family-transcriptional-regulator	gnl\|CDD\|378956	pfam12802, MarR_2, MarR family. The Mar proteins are involved in the multiple antibiotic resistance, a non-specific resistance system. The expression of the mar operon is controlled by a repressor, MarR. A large number of compounds induce transcription of the mar operon. This is thought to be due to the compound binding to MarR, and the resulting complex stops MarR binding to the DNA. With the MarR repression lost, transcription of the operon proceeds. The structure of MarR is known and shows MarR as a dimer with each subunit containing a winged-helix DNA binding motif.	0.00169552
NZ_AP017372.2\|WP_096410028.1\|2233080_2233653_-\|DUF1788-domain-containing-protein	gnl\|CDD\|378040	pfam08747, DUF1788, Domain of unknown function (DUF1788). Putative uncharacterized domain in proteins of length around 200 amino acids.	1.89717e-06
NZ_AP017372.2\|WP_096410024.1\|2223766_2224438_-\|SOS-response-associated-peptidase	gnl\|CDD\|376837	pfam02586, SRAP, SOS response associated peptidase (SRAP). The SRAP family functions as a DNA-associated autoproteolytic switch that recruits diverse repair enzymes onto DNA damage. We propose that the human protein Q96FZ2:UniProtKB, the eukaryotic member of the SRAP family, which has been recently shown to bind specifically to DNA with 5-hydroxymethylcytosine, 5-formylcytosine and 5-carboxycytosine, is a sensor for these oxidized bases generated by the TET (tetrahedral aminopeptidase of the M42 family) enzymes from methylcytosine. Hence, its autoproteolytic activity might help it act as a switch that recruits DNA repair enzymes to remove these oxidized methylcytosine species as part of the DNA demethylation pathway downstream of the TET enzymes.	2.70073e-75
NZ_AP017372.2\|WP_096410029.1\|2233633_2234419_-\|DUF1819-family-protein	gnl\|CDD\|378066	pfam08849, DUF1819, Putative inner membrane protein (DUF1819). These proteins are functionally uncharacterized. Several are annotated as putative inner membrane proteins.	3.99357e-29
NZ_AP017372.2\|WP_096410030.1\|2234415_2234907_-\|BrxE-family-protein	gnl\|CDD\|380289	NF033447, BrxE_fam, BrxE family protein. This family is uncharacterized, but a subgroup within this family is BrxE, a protein of unknown function found in type 6 BREX phage resistance systems.	3.44521e-44
NZ_AP017372.2\|WP_096410044.1\|2246306_2247005_+\|SpoIIE-family-protein-phosphatase	gnl\|CDD\|223704	COG0631, PTC1, Serine/threonine protein phosphatase [Signal transduction mechanisms].	5.92915e-08

>NZ_AP017372.2|WP_096410032.1|2236023_2236422_-|YjbQ-family-protein
MRTTITVTTHQREELVDITEPIRRAVAEAEVSDGLLALYVQGATAAIMIQENWDASVPRDAVNLLQQLVPRGVWEHDAQDGNGDSHLKAGLIGPSETIPIINGKMGLSTWQGIFLCEFDGPRRERTVVCTLN
>NZ_AP017372.2|WP_162549502.1|2235494_2235935_-|DUF488-domain-containing-protein
MHTLYTIGYERTYLEAFIATLQRASVATIIDVRASPHSRRREFAFKHLARELPGAGIGYESWPVLGAPQAARDAAKAGDAQRFYQLYASHLEEPKTQDALHSLAERAVTEAVALLCYERDPAECHRLLIAERLERSHKLASHHLAG
>NZ_AP017372.2|WP_096410030.1|2234415_2234907_-|BrxE-family-protein
MRAIEVLAELRALVGYLGEEHGWWGSQFFARSSRTFLMPVFPRSLPLSQYQGVTVAAARAHDERIGVGRIVHLFRMPELHEQAAAAVLRDATGIDQVLAHLGSREEAMQRLSALAYPVEPNEGPVLVGGWDEDLALSLGKMAGHYAAAIHENRRAYPYLRHAE
>NZ_AP017372.2|WP_096410029.1|2233633_2234419_-|DUF1819-family-protein
MSEARLYTTRLQAGLGLVDETLALLELYRSGMSVRELYTAALDSGRFPTMTARRLLNLVQEGFAPRYMEDPEVAAILKRLAEYWQRDELIQLFMLYTARANCILADFIREVFWPRYMAGFDELSRDDATAFVEAAVREGRTQKPWAPSTVRRVASYLLGTCTDFGLLGNCRLPPRPIRPVRIHPRVATYLAYNLRGLGFADRQIIRHPDWGLFGLEGDDVRQQLKRLAPEGHFIVQSAGDVTQITWGYRTMGEAVNALAGH
>NZ_AP017372.2|WP_096410028.1|2233080_2233653_-|DUF1788-domain-containing-protein
MPSLDINFNELMERIRRGREFGHASFEPIFYLVFSPEEILSVKRKMHAWTSRLANEGWEVHTFSIAQAVDEILSNAPMRQTWLMADRRKPVDWDKTNSSLANAIANGALQQRLEATLEPLEGNQHAILLVTDLEALHPYMRIGVIEGQLQGRFQVPTVFFYPGIRTGDTRLKFLGFYPEDGNYRSVHVGG
>NZ_AP017372.2|WP_109962896.1|2230107_2233065_-|BREX-system-P-loop-protein-BrxC
MAIKDLFDPSRDIYRSIEKVIAFGVSQEERLKKEIAEYVVTDAIDEQFNDLLRKMQAAMDAGGENEVGVWVSGFYGSGKSSFTKYLGLAFDESVTVDGVPFRQHLQDRLKSSSTRQLLNNVAKRFPAAVLMLDLATEQVSGATMAEVSSVLYYKVLQWAGYSRNLKVAYLERRLKQEGRYEEFLEMFREKTNGEDWSGYRNDELVIDSLIPEIAHELYPQLFPTQQAFNTESTDVVRFENDRVQEMLEIVREASGKEYVIFIIDEVGQYVGSRPQMILNLDGLAKNIKAQGQGKVWIIGTGQQTLTEDVPGASVNSQELFKLKDRFPININLQADDIKEICYRRLLGKSAEGSRQIGELFDQYGQALRQSTKLEDARAYGADFDRQTFIDLYPFLPAHFDILLHLLGSLARSTGGIGLRSAIKVIQDILVDETGNRTPVADRPVGWLANNVILYDALEKDIERAFPTIHKAVANVYKTHYVASELHQRVAKTVAVLQILGNLPITRRNVASLMHPDATQPSEATEVEGAIEDLIGDSYVPFGEQNGGLRFFSEKLNDIEQERSKLPIRQAERKRLINIALGEAFSPLPTTQLGGSLSVQSGLKVQNGGLPTSLAGERNSIQTLVELVDPADYEAARTRLTDESVTRNAEQQVLLIGRYPTEIDDLTAEIHRSQEIANKYRNEPDQEVKEYCKSQQDRAARLQGELQRQLKRSLVQGSFIFRGQVTAVETLSSDLIEAARKHLAEVATQVFDRYSEAPVCANTDLAERFLRVGNLNGVTSQLDPLGLVQTVNGQPQINTQNRAIVSIRDHVDKVGQVEGKSLTKRFSEAPFGWSQDTLRYLVAAMLMAGVIKLRVGGRDVTVNGQQAQEALKTNNAFKNVGVSLRDDSPSNEMLALAAERLTEFTGESVVPLEDEISRTAMGLFPKLQQRFAQLSAKLTSLELPGGERLGNLTQAMVEMQEADASDAPQRLWALHTSRLASWRSAA
>NZ_AP017372.2|WP_162549501.1|2228118_2230128_+|IS4-family-transposase
MLEHRLRDLGRIECYPVESDEDLRLWEELLEAEHFLGSGPLVGRRLRYLVRSENFGDVAALAFSAPALRLGARDGWIGWSDVTRAEHLDRVVCNTRFLVRGHLRVSGLASHVLGQILRRLPEDWAAKYGEPPVLVETFIDRSRHRGGCYRAANFIYIGDTAGRGRNDRYHEGGAGAKAVYLYPLCSDWRRRLGAPEQPPCTPDIDDWARHEFAHVSLGDQRLQQRLIRVGRALAAQPTASLPQACGNRAATQAAYRLFAHPRVTMNSILGSHYQATVSRCHAEPVVLAVQDTTTLNYVAHPLSEAGFGPIGSRADGAHGLIVHDTLAINPSGTPLGLIDVQAWARETEDHGLRRLGSDEWTLDNKESGKWTDSHQRASELQQQLDTGTRVVSVADREGDLFELLTAATDPERADLLVRAKHDRPLADGSGRLFGHMKALDAAGVQELTLPKRGNQKARTTRMAVTFDRVTLQPPKNKRGQEPVTLDVIRTTEINPPKGAQPVTWTLLSTVPVETLEDACERLAWYTKRWQIEVYHRTLKSGCRIEERQLGSADSLEACLGVDLVVAWRVSLLTHQSREDPNAPCTVFFTPDQWKALWVRTGAEGIPEDNDEPTLREATRTVATLGGFLGRRSDGEPGAQALWKGLQRLDDITEMFCIMIERARSGRAPP
>NZ_AP017372.2|WP_096410026.1|2226023_2227760_+|hypothetical-protein
MACLSLTREIQHERRVVQPEPDRNGGARLTDLGERSVRIEAASLHALDLLDAPRLEHLDLTGCRPGLFLALARCPHLQRIDLPAGEPGAVIHWDQHGVIDNEAVIYGAVEHLDLCGRGYAFGLPSTGAAARSWQGARICTTPASWFAATEQALIWLGSECTPVKLKIPQPARSIAIHGPGVEAVEAREDAALEAIDLHQALDLRQITLASPLYGLAIERAERLERVLASGEALQLKYCGDLLSGVLLEGTWSHALLADTTIRDDTAPVLEQVVVRGGERPIGQGQARHVHPWLPENRRTPLLASEIPLLLEAAQAGERRASTALIRWAEAVPRRNVLFALQTLYSLLERPDPPFERIWQARQTLARRFSSSQRPRPEWGWNLPEDLIEEALRMDLRLFARCRGQVTATMRLDVHLRNAPRSQVLRILAAIAADRGVPTAERSVALDLLREALAVAARGFIARPRGAEYQGPPSDLGPLVRVIIEQADRSMADDLLTWGERVVTLSKRVRYLGEFAAHGHAPSRAAALAIGLQCPPSGQHRRWGAEQAQAIRQQAMAAALTPPRSDRLADLNANQEARS
>NZ_AP017372.2|WP_096410025.1|2224733_2225732_-|WYL-domain-containing-protein
MTDTILRQWTMLQAIPRYPRGVSAPGLHERLFSEGYDIRLRTVQRDLNTLSLEFPLLCERQGNEQRWSWRPDAPVLDVPGLSPAAALAFRLAELHLSGLLAPEALRALQPHFEAAKRVLAHGGSQLANWPDRVRVISRSQPLLAPPIDQEVYDRVCQGLLEGRQLYAQYRTRSRGNELKSYRVHPFALVSRDPVTYLVATLRDYTDVRQLALHRVEAAELLEDPVVPPEGFDVDAYIEEERAFDLPEQGEPIDLELRISAGVAEHLGEAPLATDQVIEACDDGWCTLWASVPLTAQLRWWLLGFGQAVQVLEPQALREEIAAELRAAAHAYD
>NZ_AP017372.2|WP_096410024.1|2223766_2224438_-|SOS-response-associated-peptidase
MCGRFALTTPMAEIAANYFDISGVEEFTPSFNIAPGLAIATIRTGESGAVECSWARWGFRPRWADQHAPQPINARAEKAATSRYFREAFERRRCLIPASGWYEWRQENGTKQPYYITLKEEDAERVIFLAGLWEPLDEPPGACCVVLTEPAAPALETIHPRQPVVLDPACRWEWLSPERTTRTAVRQASRRLPAARLQYWRVSTAVNRPQNDGQELIQSGGSA
>NZ_AP017372.2|WP_096410033.1|2237968_2238214_-|class-I-SAM-dependent-methyltransferase
MADQYEQLYFDLVHGWLRDYLPSGGGALVLDIGAGSGRDAAWLAEQGHDVVAVEPAAELRQEAQRRHPDEWISWLGNMVPI
>NZ_AP017372.2|WP_162549503.1|2239331_2240291_+|hypothetical-protein
MNKTSPHEHRIPINRKESFYTGTIFPMLAAEGGFEALRRIITEVYPASLDIPLLKKPWRQGWDMQFFTEYSLKESIVPDTPNKMFENIELSGSKETPDIVLYFYPNDTQASPLRGTLVGIEAKMFTQPSLPDLEGQISAQRQILQQMSEKLDNCDLYQLVLIPEETIKKYDEQKLSDSVQEGRFQGWLTWNSVLDAWQKANGDYASPAGLFAKDLEFALENFDSLVSEVSRSGQNCDAKLTGKAIYNGFKEGSTDFTYKIMGCSGGLNGNRLNNHIEKSEWQYQEYEVSNQHEPFNHNWFSIDDFVKKIDNRCPKSDDH
>NZ_AP017372.2|WP_096410036.1|2240280_2241786_+|DUF2779-domain-containing-protein
MTIDLTQKASTAPRLSKSRFIAGWQCPLRLWYAVHHPELAPPPDDRQQAIFDRGHKIGELAQQRYLGGRLVAADFRHIEAAIDETNALMAKPEVPVLYEPAILHRNVLTRVDILARFASGWDIIEVKSSTRAKEVFRVDLAVQYWILRGAGVPIDRAGLLLLNRDYVYPGGEYDLQSLFRFEELTEQCQARQGWVEEQVERFQAIVAGASPPAIEPGEQCTTPYTCPFTSHCWRDREQAANPITLLPNLASSRVASLREKGIEAIEDLPPDYRLTDVQQRVRQATLSGLSWQSSGLKAALEKVSWPLFYLDFEAAMMALPPYAGMRPYDPVPFQYSCHIQRRPYGSLEHQEFLATEDGDPRTLLAESLLDTLGDSGSIIVYSGYEQATINRLAQALPDQAGRLRALIPRLVDLLAIVRNHYYHPDFRGSFSIKKVLPALVEGMDYLDMEVADGEAAGRAWQQMLASEDTAEQERLAAALRAYCRQDSLAMYRLREALMELT
>NZ_AP017372.2|WP_096410037.1|2241823_2242126_-|hypothetical-protein
MPDDGTGSLPLLRHIILNDNKSSTNKLALLRTLCRIADGADGLAVVDDNDKIKLHMGLVALTWIRLFMPMLRASIPQLPKHQEAQKGWVLPETVSVTALG
>NZ_AP017372.2|WP_096410039.1|2242497_2243277_-|hypothetical-protein
MNYTNFWIDGRSFEKARNHFRAAVADPKARPNQKVVLDLNEHAYMLGMELTHGYPFIRNDGLSMTIHDHELTPRENSYNIIDLINIRFTERALKGAYTNLVYHEEAQQFEEKLSNLNVQRREDALKFSEEVCRWGRGMRVWGRLNQHYSQSQLGEAISSWLSSVRNYDSYIDPISQGVSIRGLGVSFASKHLRLLDPSRFAVLDSVLSEGLGYALTPQGYNLFMNDLVKIKNDYLQEWRLCDIEASIFALVRQRVITTG
>NZ_AP017372.2|WP_109962898.1|2244148_2244493_+|IS1634-family-transposase
MVDRYRSLADIERGFRALKSTLQIAPVHHRLPDRMRAHALICFLALILYRVLRMRLKANKSEYSVERALEALESVQWHRVKINGESHTGVSVSNLQRKLFKDMEVKPPKQATTA
>NZ_AP017372.2|WP_096410042.1|2244945_2245599_+|MarR-family-transcriptional-regulator
MKSQDIGLLLKLVALRSREGHGHDTHASKGAKALPDDWRDWALDDVGSDLCQESMPGLDDDQLLSRYSVRALAEETGISKSQVSLALQRCLEVGLVRKERSTGVPRANVRALLKFIVHGVRYVFPAKPGEITRGIATTFAAPVLEGQLYSAGELPMVWPDARGNSKGQAIEPLFKSVPFAVRRDPELYAMLALVDAIRLGHPRESKVAAERLAEYLE
>NZ_AP017372.2|WP_096410043.1|2245602_2246307_+|hypothetical-protein
MSLFDDQRAMLRRVAEGLGTELRDQVAFVGGCTTGLLLTDAFTREQVRSTDDVDLIISVMTYAHLNRFKEALKTKGFKDPSPMDGEMPICAMKLGELRIDLIPDHDEVLGFSNHWYPLALKTAEPVSLGGDLTIRVVTPPLFIATKLEAYKGRGESDPLSSNDIEDILNLVDGRPELLDEVRAADSALQAYIAAELSELLGKDDFSYAVQSQAGDPDREALLFERLEILTGVRG
>NZ_AP017372.2|WP_096410044.1|2246306_2247005_+|SpoIIE-family-protein-phosphatase
MQARWFSQQGRERARNSDAAAVGQQGQHLLAVLVDGAEKGPRGAELARHWADTVMQALAEASTRSQATVGARLRQAHAQLRHDFLHDIASYCMVSLDLETLAMHVWHCGDCRVGLRRPTKTRWLTTPHLLVHQPGLPSSCSPEEQERREQQLTRSLNARRFCPPENHVFSLCQDQTLLLSTDGYWQEHLEAGTPRDCLQDDASLLTLPVRPGSLAHVEQASDTDNLRYVSPA
>NZ_AP017372.2|WP_096410046.1|2249040_2249862_+|type-IV-toxin-antitoxin-system-AbiEi-family-antitoxin
MSRQKRDNLKRLLEAVPAGFLVDSAWLERHGIGRRSTYAYVKNGWLTRVHRGVFRRPAPNAPKTGVIDWKVCLLSMQYVMGYDVHVGGTSALGQHGFDHYLHLGSNVPVRVYGDAIPTWLVRLPLSAPIETRRTSLFVDRALGLTKDNKDAATILSWDWQLRISSPERAVMEAMDELPTHETFHNLDRIFESLTTLRPRTLSALLHSCKKIKVKRLFFVFADRHDHPWRKRLDAEEFNLGSGDRALVSGGRMHPRYRIMVPEDFVKPEVSDGA

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_AP017372_8

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_AP017372_8

2254998-2255176

TypeIII

Consensus_repeat	Method
TGTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	PILER-CR
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	CRISPRCasFinder

2 spacers

The CRISPR arrays of NZ_AP017372_8

>merge|NZ_AP017372|8|2254998-2255176|PILER-CR,CRISPRCasFinder
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGACCCTGCGGGCGGCTTTCTTTACCTCCCTTCGGCACTGTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGACTTTTTGACACCGGCTAATCGTCTACGCGATAGCCCTGTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC

>NZ_AP017372|8|5|2254998-2255176|PILER-CR
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGACC	CTGCGGGCGGCTTTCTTTACCTCCCTTCGGCACT
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGACT	TTTTGACACCGGCTAATCGTCTACGCGATAGCCCT
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC

>NZ_AP017372|8|7|2254998-2255176|CRISPRCasFinder
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	CCTGCGGGCGGCTTTCTTTACCTCCCTTCGGCACT
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	TTTTTGACACCGGCTAATCGTCTACGCGATAGCCCT
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC

Protein	Signature genes	Signature genes Name	Protein_function
NZ_AP017372.2\|WP_096410053.1\|2263122_2264055_+\|acetoin-utilization-protein-AcuC	unknown	unknown	gnl\|CDD\|212520
NZ_AP017372.2\|WP_096410044.1\|2246306_2247005_+\|SpoIIE-family-protein-phosphatase	unknown	unknown	gnl\|CDD\|223704
NZ_AP017372.2\|WP_096410043.1\|2245602_2246307_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|227186
NZ_AP017372.2\|WP_096410056.1\|2265315_2265723_-\|YjbQ-family-protein	unknown	unknown	gnl\|CDD\|223509
NZ_AP017372.2\|WP_096410411.1\|2250797_2250959_-\|IS3-family-transposase	unknown	unknown	gnl\|CDD\|379098
NZ_AP017372.2\|WP_096410048.1\|2253105_2253744_-\|RES-family-NAD+-phosphorylase	unknown	unknown	gnl\|CDD\|378053
NZ_AP017372.2\|WP_096410055.1\|2264730_2265279_-\|peptide-methionine-(S)-S-oxide-reductase-MsrA	unknown	unknown	gnl\|CDD\|237597
NZ_AP017372.2\|WP_096410042.1\|2244945_2245599_+\|MarR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|378956
NZ_AP017372.2\|WP_096410039.1\|2242497_2243277_-\|hypothetical-protein	unknown	unknown	unknown
NZ_AP017372.2\|WP_096410412.1\|2253796_2254171_-\|DUF2384-domain-containing-protein	unknown	unknown	gnl\|CDD\|378249
NZ_AP017372.2\|WP_109962898.1\|2244148_2244493_+\|IS1634-family-transposase	unknown	unknown	gnl\|CDD\|227708
NZ_AP017372.2\|WP_096410046.1\|2249040_2249862_+\|type-IV-toxin-antitoxin-system-AbiEi-family-antitoxin	unknown	unknown	gnl\|CDD\|371541
NZ_AP017372.2\|WP_162549507.1\|2264182_2264623_-\|DUF488-domain-containing-protein	unknown	unknown	gnl\|CDD\|377317
NZ_AP017372.2\|WP_162549506.1\|2261142_2261535_-\|hypothetical-protein	unknown	unknown	unknown
NZ_AP017372.2\|WP_096410049.1\|2257731_2259141_+\|DUF262-domain-containing-protein	unknown	unknown	gnl\|CDD\|377008
NZ_AP017372.2\|WP_162549505.1\|2257333_2257504_-\|hypothetical-protein	unknown	unknown	unknown
NZ_AP017372.2\|WP_162549504.1\|2251801_2252302_+\|cyclin-dependent-kinase-inhibitor-3-family-protein	unknown	unknown	gnl\|CDD\|350355
NZ_AP017372.2\|WP_096410050.1\|2259133_2261071_+\|DUF262-domain-containing-protein	unknown	unknown	gnl\|CDD\|377008
NZ_AP017372.2\|WP_096410052.1\|2261964_2262939_+\|L,D-transpeptidase-family-protein	unknown	unknown	gnl\|CDD\|182294
NZ_AP017372.2\|WP_096410051.1\|2261526_2261805_+\|hypothetical-protein	unknown	unknown	unknown

Protein	Function_ID	Function_description	E-value
NZ_AP017372.2\|WP_096410053.1\|2263122_2264055_+\|acetoin-utilization-protein-AcuC	gnl\|CDD\|212520	cd09994, HDAC_AcuC_like, Class I histone deacetylase AcuC (Acetoin utilization protein)-like enzymes. AcuC (Acetoin utilization protein) is a class I deacetylase found only in bacteria and is involved in post-translational control of the acetyl-coenzyme A synthetase (AcsA). Deacetylase AcuC works in coordination with deacetylase SrtN (class III), possibly to maintain AcsA in active (deacetylated) form and let the cell grow under low concentration of acetate. B. subtilis AcuC is a member of operon acuABC; this operon is repressed by the presence of glucose and does not show induction by acetoin; acetoin is a bacterial fermentation product that can be converted to acetate via the butanediol cycle in absence of other carbon sources. Inactivation of AcuC leads to slower growth and lower cell yield under low-acetate conditions in Bacillus subtilis. In general, Class I histone deacetylases (HDACs) are Zn-dependent enzymes that catalyze hydrolysis of N(6)-acetyl-lysine residues in histone amino termini to yield a deacetylated histone (EC 3.5.1.98). Enzymes belonging to this group participate in regulation of a number of processes through protein (mostly different histones) modification (deacetylation). Class I histone deacetylases in general act via the formation of large multiprotein complexes. Members of this class are involved in cell cycle regulation, DNA damage response, embryonic development, cytokine signaling important for immune response and in posttranslational control of the acetyl coenzyme A synthetase.	3.39207e-116
NZ_AP017372.2\|WP_096410044.1\|2246306_2247005_+\|SpoIIE-family-protein-phosphatase	gnl\|CDD\|223704	COG0631, PTC1, Serine/threonine protein phosphatase [Signal transduction mechanisms].	5.92915e-08
NZ_AP017372.2\|WP_096410043.1\|2245602_2246307_+\|hypothetical-protein	gnl\|CDD\|227186	COG4849, COG4849, Predicted nucleotidyltransferase [General function prediction only].	3.24266e-06
NZ_AP017372.2\|WP_096410056.1\|2265315_2265723_-\|YjbQ-family-protein	gnl\|CDD\|223509	COG0432, COG0432, Uncharacterized conserved protein [Function unknown].	3.13581e-48
NZ_AP017372.2\|WP_096410411.1\|2250797_2250959_-\|IS3-family-transposase	gnl\|CDD\|379098	pfam13276, HTH_21, HTH-like domain. This domain contains a predicted helix-turn-helix suggesting a DNA-binding function.	0.00074413
NZ_AP017372.2\|WP_096410048.1\|2253105_2253744_-\|RES-family-NAD+-phosphorylase	gnl\|CDD\|378053	pfam08808, RES, RES domain. This presumed domain contains 3 highly conserved polar groups that could form an active site. These are an arginine, glutamate and serine, hence the RES domain. The domain is found widely distributed in bacteria. The domain is about 150 residues in length.	5.97618e-22
NZ_AP017372.2\|WP_096410042.1\|2244945_2245599_+\|MarR-family-transcriptional-regulator	gnl\|CDD\|378956	pfam12802, MarR_2, MarR family. The Mar proteins are involved in the multiple antibiotic resistance, a non-specific resistance system. The expression of the mar operon is controlled by a repressor, MarR. A large number of compounds induce transcription of the mar operon. This is thought to be due to the compound binding to MarR, and the resulting complex stops MarR binding to the DNA. With the MarR repression lost, transcription of the operon proceeds. The structure of MarR is known and shows MarR as a dimer with each subunit containing a winged-helix DNA binding motif.	0.00169552
NZ_AP017372.2\|WP_096410052.1\|2261964_2262939_+\|L,D-transpeptidase-family-protein	gnl\|CDD\|182294	PRK10190, PRK10190, L,D-transpeptidase; Provisional.	3.78572e-43
NZ_AP017372.2\|WP_096410412.1\|2253796_2254171_-\|DUF2384-domain-containing-protein	gnl\|CDD\|378249	pfam09722, DUF2384, Protein of unknown function (DUF2384). Proteins in this family are found almost exclusively in the Proteobacteria, but also in Gloeobacter violaceus PCC 7421, a cyanobacterium. The function is unknown.	4.61865e-05
NZ_AP017372.2\|WP_109962898.1\|2244148_2244493_+\|IS1634-family-transposase	gnl\|CDD\|227708	COG5421, COG5421, Transposase [DNA replication, recombination, and repair].	3.39282e-11
NZ_AP017372.2\|WP_096410049.1\|2257731_2259141_+\|DUF262-domain-containing-protein	gnl\|CDD\|377008	pfam03235, DUF262, Protein of unknown function DUF262.	1.80949e-28
NZ_AP017372.2\|WP_162549507.1\|2264182_2264623_-\|DUF488-domain-containing-protein	gnl\|CDD\|377317	pfam04343, DUF488, Protein of unknown function, DUF488. This family includes several proteins of uncharacterized function.	1.13293e-22
NZ_AP017372.2\|WP_096410055.1\|2264730_2265279_-\|peptide-methionine-(S)-S-oxide-reductase-MsrA	gnl\|CDD\|237597	PRK14054, PRK14054, peptide-methionine (S)-S-oxide reductase.	7.59283e-92
NZ_AP017372.2\|WP_096410046.1\|2249040_2249862_+\|type-IV-toxin-antitoxin-system-AbiEi-family-antitoxin	gnl\|CDD\|371541	pfam11459, AbiEi_3, Transcriptional regulator, AbiEi antitoxin, Type IV TA system. AbiEi_3 is the cognate antitoxin of the type IV toxin-antitoxin 'innate immunity' bacterial abortive infection (Abi) system that protects bacteria from the spread of a phage infection. The Abi system is activated upon infection with phage to abort the cell thus preventing the spread of phage through viral replication. There are some 20 or more Abis, and they are predominantly plasmid-encoded lactococcal systems. TA, toxin-antitoxin, systems on plasmids function by killing cells that lose the plasmid upon division. AbiE phage resistance systems function as novel Type IV TAs and are widespread in bacteria and archaea. The cognate antitoxin is pfam13338.	2.97259e-54
NZ_AP017372.2\|WP_162549504.1\|2251801_2252302_+\|cyclin-dependent-kinase-inhibitor-3-family-protein	gnl\|CDD\|350355	cd14505, CDKN3-like, cyclin-dependent kinase inhibitor 3 and similar proteins. This family is composed of eukaryotic cyclin-dependent kinase inhibitor 3 (CDKN3) and related archaeal and bacterial proteins. CDKN3 is also known as kinase-associated phosphatase (KAP), CDK2-associated dual-specificity phosphatase, cyclin-dependent kinase interactor 1 (CDI1), or cyclin-dependent kinase-interacting protein 2 (CIP2). It has been characterized as dual-specificity phosphatase, which function as a protein-serine/threonine phosphatase (EC 3.1.3.16) and protein-tyrosine-phosphatase (EC 3.1.3.48). It dephosphorylates CDK2 at a threonine residue in a cyclin-dependent manner, resulting in the inhibition of G1/S cell cycle progression. It also interacts with CDK1 and controls progression through mitosis by dephosphorylating CDC2. CDKN3 may also function as a tumor suppressor; its loss of function was found in a variety of cancers including glioblastoma and hepatocellular carcinoma. However, it has also been found over-expressed in many cancers such as breast, cervical, lung and prostate cancers, and may also have an oncogenic function.	5.31563e-45
NZ_AP017372.2\|WP_096410050.1\|2259133_2261071_+\|DUF262-domain-containing-protein	gnl\|CDD\|377008	pfam03235, DUF262, Protein of unknown function DUF262.	2.64983e-25

>NZ_AP017372.2|WP_096410412.1|2253796_2254171_-|DUF2384-domain-containing-protein
MTARKQHQLGAAGLRAYPNIARAWGLTETQAARLLGAPESTYRRWKRNPERASLDVNHLERLSLILGIHKNLHILLPREDAANSWVRRPNTNPLFAGHTPLERMLGGQVGDLVAVRQHLDGARG
>NZ_AP017372.2|WP_096410048.1|2253105_2253744_-|RES-family-NAD+-phosphorylase
MVTSRFPPIALFEGIAGDPADLDALNELEGLTANRLREEAGEIHLIKQEDRRYGPRWSPIMAALCYPRPSRFTDCSFGVYYCADNERTAVAETRYHRERFQAESNEPPMAVEMRVYIAELDADLLDLRGDTNLATSYLDPDSYANSQRLGAIARMHDHYGLAYPSVRDQEGGDCAAVFRPPALGPTRQGKHFEYRWDGQRITAVVELRETNY
>NZ_AP017372.2|WP_162549504.1|2251801_2252302_+|cyclin-dependent-kinase-inhibitor-3-family-protein
MTLCPGKIGPGRVHPWQRKLDDDIESIVQWGASRVVTLMENSELVSFGVGDLGARIRERLGDHCWHHLPIIDGSVPSAKAEKNWEPIADDLHSCLGAGERICIHCLGGLGRTGVIACRLLVELGFSPDEALGRVRQARPGAVETKEQLDYVTRLPELPAVQKRISN
>NZ_AP017372.2|WP_096410411.1|2250797_2250959_-|IS3-family-transposase
MSDEQLHQEIRALIQGSAFTGEGHRKVWAKLRQLRGVYTSRKRVLRVMREHEH
>NZ_AP017372.2|WP_096410046.1|2249040_2249862_+|type-IV-toxin-antitoxin-system-AbiEi-family-antitoxin
MSRQKRDNLKRLLEAVPAGFLVDSAWLERHGIGRRSTYAYVKNGWLTRVHRGVFRRPAPNAPKTGVIDWKVCLLSMQYVMGYDVHVGGTSALGQHGFDHYLHLGSNVPVRVYGDAIPTWLVRLPLSAPIETRRTSLFVDRALGLTKDNKDAATILSWDWQLRISSPERAVMEAMDELPTHETFHNLDRIFESLTTLRPRTLSALLHSCKKIKVKRLFFVFADRHDHPWRKRLDAEEFNLGSGDRALVSGGRMHPRYRIMVPEDFVKPEVSDGA
>NZ_AP017372.2|WP_096410044.1|2246306_2247005_+|SpoIIE-family-protein-phosphatase
MQARWFSQQGRERARNSDAAAVGQQGQHLLAVLVDGAEKGPRGAELARHWADTVMQALAEASTRSQATVGARLRQAHAQLRHDFLHDIASYCMVSLDLETLAMHVWHCGDCRVGLRRPTKTRWLTTPHLLVHQPGLPSSCSPEEQERREQQLTRSLNARRFCPPENHVFSLCQDQTLLLSTDGYWQEHLEAGTPRDCLQDDASLLTLPVRPGSLAHVEQASDTDNLRYVSPA
>NZ_AP017372.2|WP_096410043.1|2245602_2246307_+|hypothetical-protein
MSLFDDQRAMLRRVAEGLGTELRDQVAFVGGCTTGLLLTDAFTREQVRSTDDVDLIISVMTYAHLNRFKEALKTKGFKDPSPMDGEMPICAMKLGELRIDLIPDHDEVLGFSNHWYPLALKTAEPVSLGGDLTIRVVTPPLFIATKLEAYKGRGESDPLSSNDIEDILNLVDGRPELLDEVRAADSALQAYIAAELSELLGKDDFSYAVQSQAGDPDREALLFERLEILTGVRG
>NZ_AP017372.2|WP_096410042.1|2244945_2245599_+|MarR-family-transcriptional-regulator
MKSQDIGLLLKLVALRSREGHGHDTHASKGAKALPDDWRDWALDDVGSDLCQESMPGLDDDQLLSRYSVRALAEETGISKSQVSLALQRCLEVGLVRKERSTGVPRANVRALLKFIVHGVRYVFPAKPGEITRGIATTFAAPVLEGQLYSAGELPMVWPDARGNSKGQAIEPLFKSVPFAVRRDPELYAMLALVDAIRLGHPRESKVAAERLAEYLE
>NZ_AP017372.2|WP_109962898.1|2244148_2244493_+|IS1634-family-transposase
MVDRYRSLADIERGFRALKSTLQIAPVHHRLPDRMRAHALICFLALILYRVLRMRLKANKSEYSVERALEALESVQWHRVKINGESHTGVSVSNLQRKLFKDMEVKPPKQATTA
>NZ_AP017372.2|WP_096410039.1|2242497_2243277_-|hypothetical-protein
MNYTNFWIDGRSFEKARNHFRAAVADPKARPNQKVVLDLNEHAYMLGMELTHGYPFIRNDGLSMTIHDHELTPRENSYNIIDLINIRFTERALKGAYTNLVYHEEAQQFEEKLSNLNVQRREDALKFSEEVCRWGRGMRVWGRLNQHYSQSQLGEAISSWLSSVRNYDSYIDPISQGVSIRGLGVSFASKHLRLLDPSRFAVLDSVLSEGLGYALTPQGYNLFMNDLVKIKNDYLQEWRLCDIEASIFALVRQRVITTG
>NZ_AP017372.2|WP_162549505.1|2257333_2257504_-|hypothetical-protein
MATPYEKLKSLANAEQYLKPGVTFKQLDEIAYAICDNEAARQLNEGSSQKTEKIVR
>NZ_AP017372.2|WP_096410049.1|2257731_2259141_+|DUF262-domain-containing-protein
MTVVVASCTVAKLFSGETFEASDGTLIEGNLHLPEYQRPYRWGEAQIRRLLEDLRRYFCPPHPGSSPAHLFYLGSIILHQDGEGRLNIIDGQQRLTTMALLMWQQAPGSEPKLRYESPLSHAQIRKNQEWLKQQENWNRAWLKLERINITVVVTRSEDDAYCFFETQNTGGVRLSGPDIIKAHHLRATPRSRQDRYARLWESLGDLNPVVDAVLKARSWNALNFRHVPSRREPLSVRETVVTELAENTGEGHADVAYGLTATSRTPDGAVVQVAHADGYAMRQPLNAGINSIHYLEYFESLRRILLTNHREPDLDSFHNFYQGLIVGRQGCSYLKKLYDSCLLLYASHFGRSQLFEASLRLFRVVYAPRVTNEKTVKEATASKFVRENPVFDWILMSYTHEQCMERLRLFEVKVSAKNLGQSDDGVKKRFVQAVNEWFSLELPKDRMAEQYDDALQKAIKSTLEVVNHG
>NZ_AP017372.2|WP_096410050.1|2259133_2261071_+|DUF262-domain-containing-protein
MDNCVLTQVQAPAAILDEDIAFVIPSYQRPYVWPDDAVVKLFDDIFRAWQWDACSNYYIGTVLTAPISHIEGAAYELIDGQQRITTLMLIALAFRVTGQETALNPLAERGNAPRLTFAIREQVQALLGYWSGLDGYQYPGEDAVKTNPYLTRLDDALNVLKQLVGAIEKDRRIELAGYIHTNVQWVNNTMPGSMDLNRLFATMNTRGVQLEQSDILKSMLLRRISTDKSRYEAIWQACEQMDNYFERNVRQIFGGTDWSDMLPEHLRHFDPARFLLSEEQNLEAERPGSGLTISQLADSSYPDENEGSSALDLDDTVYCQSIIGFPLLLMHALRIYTARSGYADIGGRLHSERLIDSFSVLVDASETEVKEFVECLWEVRYQFDRWVVKWVERSDEDERQLRLTDINRSPSNGNWYLTRSVKKLFELVPLQSVRHFTGEHSAQYWLTPFLGLLCMETNPSENTVLDIMERIDNQLSLAEASQKQASFELLSGDVSAQRSVAAIIEYLKTPCGTKFEHYWFQKLEYLLWKRDHSQDEKVLNYRIVSRNSIEHVYAQNEEFKNEMKRDYLDAFGNLVLLNPSENSSYGYQSVNKKKADFKDRSHYNGSYDSLKLKEIFSLMGQGEWSPNLVEAHQEAMFELISCHYS
>NZ_AP017372.2|WP_162549506.1|2261142_2261535_-|hypothetical-protein
MQHFRFLLELIFELLGALLVAVSLVGDLIGALSEKGKNRTLGQLQRPYSPELARAGLKVTKQSGHKGSCKPKMTGSEFESVKKLLARGVPPNHVAKALGRCTAGRRRQRMLSVRFFPFSERAPTGVSNST
>NZ_AP017372.2|WP_096410051.1|2261526_2261805_+|hypothetical-protein
MLQRKLDSAHQERNQAEHERHRLEKDYASLQSQVDRHKERIEQLQAEVMQERERHQEAQELARYHQEQSQALMEVLRRGDGTGEEMEGGGYS
>NZ_AP017372.2|WP_096410052.1|2261964_2262939_+|L,D-transpeptidase-family-protein
MWLCSPTICTAAAAALLAPALAGPSTASAGPGDRERALHRYEAPAQVEVVGGVYHVPVKPDEALAEVAEREGVGVERLRAANPHTATENASERALRIPARHVLPDTPREGLVIDVAGMRLFHYPEETDAVEVFPISTGREGWPTPVAMKTEVAERLENPAWYPPESIRDSRAASDESGSLPRMVPPGAENPLGEHVLILEVDGYLVHGTNEPHSIGERTSHGCARMHPQDIEHLFERVKAGTPVRFVDQPFRIGRSARGEVWVESHPSAPDGSNPELDRRFVRALPDIAGEGVAINGARLIEAVNDQDGIAVRVSVGEEGAGKR
>NZ_AP017372.2|WP_096410053.1|2263122_2264055_+|acetoin-utilization-protein-AcuC
MTGVPLRIATDKRLGAYHFGPGHPFGPGRMAAFLEALDELELAYEALPLAEADTATLTRFHAREYVERVQSLAGTGAPLDLGDTPAVPGIDGAAKRVVGTVAAAVDDLLAGRVRRAFVPIAGLHHGQRDRASGFCVYNDCGVALETLLAAGVAPVAYVDIDVHHGDGVYDSFETDPRVIFADIHQDGRTLFPGTGAAEAQGKGAAHGTKLNVPLPPGADDDAFVEAWERIEAHLERHQPKVIVMQCGADGLAGDPLASLRYTSKTHASAARRLRVLTERWAEGRLLALGGGGYDLSNIAAAWTAVVREIA
>NZ_AP017372.2|WP_162549507.1|2264182_2264623_-|DUF488-domain-containing-protein
MHTLYTTGYERTDLDTFIVTLQRASVATVIDVRASPHSRRREFAFKHLARELPGAGIGYESWPVLGAPQAARDAAKVGDAQRFYQLYASHLEEPKPKDALHSLAERAVTEAVALLCYERDPAECHRLLIAERLERSHKLASHHLAG
>NZ_AP017372.2|WP_096410055.1|2264730_2265279_-|peptide-methionine-(S)-S-oxide-reductase-MsrA
MRVSRSITVGGGCFWCIEGVFQQLPAVHQAISGYAGGESPDPSYREVCSGRTGHAEVVQVNFDPEQVEERALMELFFAIHDPTLHNRQGPDVGSQYRSIILYADKEQRQTAEAVIKEIGAAGEYSAPIVTELVPLTTFYPAEEMHQRYYEAAPEAPYCRSMIAPKIAKARERFPRLFDGWAN
>NZ_AP017372.2|WP_096410056.1|2265315_2265723_-|YjbQ-family-protein
MRKTITVTTHQREELVDITEPIRRAVAEAEVSDGLLALYVQGATAAIMIQENWDASVPRDAVNLLQQLVPRGVWEHDSQDGNGDSHLKAGLIGPSETIPIINSKMGLSTWQGIFLACEFDGPRRERTVVCTLIAM

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_AP017372_9

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_AP017372_9

2266356-2266887

TypeIII

Consensus_repeat	Method
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTA	PILER-CR
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	CRISPRCasFinder
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	CRT

7 spacers

csx16,csx1,cas6,cas10,csm2gr11,csm3gr7,csm4gr5,csm5gr7

The CRISPR arrays of NZ_AP017372_9

>merge|NZ_AP017372|9|2266356-2266887|PILER-CR,CRISPRCasFinder,CRT
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGACCCTATAGTTCGTTGAAATATATCAATCGCTTCCCTGTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGACCTGGACCTTGACAGGATTTTGGTTGCCTACACTATCGTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGACGGCGTCCTTTTGGACGTAGGGCACCGCCTTCATCACGTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGACGCGCACTCCGGGCTTATTTCGTCACGCTCGAGTTGGTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGACCCCACCAGTGCGTAAGAGTTGTCATACGCGGATGTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGACAATTTTATGTTGAACCATTCCGTGTCCTGGTCCGTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGACAATTCCTTTCTGATAGCTGTTAACGATTCAACAGCCGTCTGAATCTGGCCCTGTTTGAGAAGGGATTAGAGT

>NZ_AP017372|9|6|2266356-2266883|PILER-CR
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTA	AGACCCTATAGTTCGTTGAAATATATCAATCGCTTCCCT
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTA	AGACCTGGACCTTGACAGGATTTTGGTTGCCTACACTATC
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTA	AGACGGCGTCCTTTTGGACGTAGGGCACCGCCTTCATCAC
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTA	AGACGCGCACTCCGGGCTTATTTCGTCACGCTCGAGTTG
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTA	AGACCCCACCAGTGCGTAAGAGTTGTCATACGCGGAT
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTA	AGACAATTTTATGTTGAACCATTCCGTGTCCTGGTCC
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTA	AGACAATTCCTTTCTGATAGCTGTTAACGATTCAACAGCC
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTA

>NZ_AP017372|9|8|2266356-2266887|CRISPRCasFinder
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	CCTATAGTTCGTTGAAATATATCAATCGCTTCCCT
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	CTGGACCTTGACAGGATTTTGGTTGCCTACACTATC
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	GGCGTCCTTTTGGACGTAGGGCACCGCCTTCATCAC
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	GCGCACTCCGGGCTTATTTCGTCACGCTCGAGTTG
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	CCCACCAGTGCGTAAGAGTTGTCATACGCGGAT
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	AATTTTATGTTGAACCATTCCGTGTCCTGGTCC
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	AATTCCTTTCTGATAGCTGTTAACGATTCAACAGCC
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAGAGT

>NZ_AP017372|9|3|2266356-2266887|CRT
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	CCTATAGTTCGTTGAAATATATCAATCGCTTCCCT
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	CTGGACCTTGACAGGATTTTGGTTGCCTACACTATC
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	GGCGTCCTTTTGGACGTAGGGCACCGCCTTCATCAC
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	GCGCACTCCGGGCTTATTTCGTCACGCTCGAGTTG
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	CCCACCAGTGCGTAAGAGTTGTCATACGCGGAT
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	AATTTTATGTTGAACCATTCCGTGTCCTGGTCC
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	AATTCCTTTCTGATAGCTGTTAACGATTCAACAGCC
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAGAGT

Protein	Signature genes	Signature genes Name	Protein_function
NZ_AP017372.2\|WP_096410060.1\|2269976_2272607_+\|type-III-A-CRISPR-associated-protein-Cas10/Csm1	cas10	cd09680_cas10_CAS-III	gnl\|CDD\|187811
NZ_AP017372.2\|WP_096410062.1\|2273055_2273859_+\|type-III-A-CRISPR-associated-RAMP-protein-Csm3	csm3gr7	cd09684_csm3gr7_CAS-III-A:CAS-III-D	gnl\|CDD\|187815
NZ_AP017372.2\|WP_096410051.1\|2261526_2261805_+\|hypothetical-protein	unknown	unknown	unknown
NZ_AP017372.2\|WP_096410056.1\|2265315_2265723_-\|YjbQ-family-protein	unknown	unknown	gnl\|CDD\|223509
NZ_AP017372.2\|WP_096410050.1\|2259133_2261071_+\|DUF262-domain-containing-protein	unknown	unknown	gnl\|CDD\|377008
NZ_AP017372.2\|WP_096410058.1\|2267478_2268606_+\|TIGR02584-family-CRISPR-associated-protein	csx1	pfam09623_csx1_CAS-III	gnl\|CDD\|187872
NZ_AP017372.2\|WP_096410057.1\|2267048_2267339_-\|CRISPR-associated-protein-Csx16	csx16	pfam09652_csx16_CAS-I:CAS-III	gnl\|CDD\|370601
NZ_AP017372.2\|WP_162549510.1\|2277575_2278202_+\|CRISPR-system-precrRNA-processing-endoribonuclease-RAMP-protein-Cas6	cas6	mkCas0066_cas6_CAS-I:CAS-III	gnl\|CDD\|337605
NZ_AP017372.2\|WP_162549509.1\|2269236_2269980_+\|CRISPR-system-precrRNA-processing-endoribonuclease-RAMP-protein-Cas6	cas6	mkCas0066_cas6_CAS-I:CAS-III	gnl\|CDD\|337605
NZ_AP017372.2\|WP_096410053.1\|2263122_2264055_+\|acetoin-utilization-protein-AcuC	unknown	unknown	gnl\|CDD\|212520
NZ_AP017372.2\|WP_096410063.1\|2273873_2274869_+\|type-III-A-CRISPR-associated-RAMP-protein-Csm4	csm4gr5	COG1567_csm4gr5_CAS-III-A	gnl\|CDD\|187794
NZ_AP017372.2\|WP_096410052.1\|2261964_2262939_+\|L,D-transpeptidase-family-protein	unknown	unknown	gnl\|CDD\|182294
NZ_AP017372.2\|WP_096410049.1\|2257731_2259141_+\|DUF262-domain-containing-protein	unknown	unknown	gnl\|CDD\|377008
NZ_AP017372.2\|WP_162549507.1\|2264182_2264623_-\|DUF488-domain-containing-protein	unknown	unknown	gnl\|CDD\|377317
NZ_AP017372.2\|WP_096410064.1\|2274869_2276369_+\|hypothetical-protein	csm5gr7	cd09662_csm5gr7_CAS-III-A	gnl\|CDD\|187793
NZ_AP017372.2\|WP_096410061.1\|2272603_2273053_+\|type-III-A-CRISPR-associated-protein-Csm2	csm2gr11	pfam03750_csm2gr11_CAS-III-A	gnl\|CDD\|367635
NZ_AP017372.2\|WP_162549506.1\|2261142_2261535_-\|hypothetical-protein	unknown	unknown	unknown
NZ_AP017372.2\|WP_162549505.1\|2257333_2257504_-\|hypothetical-protein	unknown	unknown	unknown
NZ_AP017372.2\|WP_096410055.1\|2264730_2265279_-\|peptide-methionine-(S)-S-oxide-reductase-MsrA	unknown	unknown	gnl\|CDD\|237597
NZ_AP017372.2\|WP_162549508.1\|2268630_2268822_-\|hypothetical-protein	unknown	unknown	unknown

Protein	Function_ID	Function_description	E-value
NZ_AP017372.2\|WP_096410060.1\|2269976_2272607_+\|type-III-A-CRISPR-associated-protein-Cas10/Csm1	gnl\|CDD\|187811	cd09680, Cas10_III, CRISPR/Cas system-associated protein Cas10. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Multidomain protein with permuted HD nuclease domain, palm domain and Zn-ribbon; signature gene for type III; also known as Csm1 family.	7.95833e-114
NZ_AP017372.2\|WP_096410062.1\|2273055_2273859_+\|type-III-A-CRISPR-associated-RAMP-protein-Csm3	gnl\|CDD\|187815	cd09684, Csm3_III-A, CRISPR/Cas system-associated RAMP superfamily protein Csm3. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; RAMP superfamily protein.	3.25432e-74
NZ_AP017372.2\|WP_096410056.1\|2265315_2265723_-\|YjbQ-family-protein	gnl\|CDD\|223509	COG0432, COG0432, Uncharacterized conserved protein [Function unknown].	3.13581e-48
NZ_AP017372.2\|WP_096410055.1\|2264730_2265279_-\|peptide-methionine-(S)-S-oxide-reductase-MsrA	gnl\|CDD\|237597	PRK14054, PRK14054, peptide-methionine (S)-S-oxide reductase.	7.59283e-92
NZ_AP017372.2\|WP_096410058.1\|2267478_2268606_+\|TIGR02584-family-CRISPR-associated-protein	gnl\|CDD\|187872	cd09741, Csx1_III-U, CRISPR/Cas system-associated protein Csx1. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Protein of this family often fused to HTH domain; Some proteins could have an additional fusion with RecB-family nuclease domain; Core domain appears to have a Rossmann-like fold; loosely associated with CRISPR/Cas systems; also known as NE0113 family.	2.55477e-89
NZ_AP017372.2\|WP_096410057.1\|2267048_2267339_-\|CRISPR-associated-protein-Csx16	gnl\|CDD\|370601	pfam09652, Cas_VVA1548, Putative CRISPR-associated protein (Cas_VVA1548). This entry represents a conserved region of about 95 amino acids found exclusively in species with CRISPRs (Clustered Regularly Interspaced Short Palindromic Repeats). In all bacterial species that contain this entry, the genes encoding the proteins are in the midst of a cluster of cas (CRISPR-associated) genes.	8.56222e-41
NZ_AP017372.2\|WP_162549510.1\|2277575_2278202_+\|CRISPR-system-precrRNA-processing-endoribonuclease-RAMP-protein-Cas6	gnl\|CDD\|337605	pfam10040, CRISPR_Cas6, CRISPR-associated endoribonuclease Cas6. Cas6 is a member of the RAMP (repeat-associated mysterious protein) superfamily. It is among the most widely distributed Cas proteins and is found in both bacteria and archaea. Cas6 functions in the generation of CRISPR-derived guide RNAs for invader defense in prokaryotes.	1.68563e-07
NZ_AP017372.2\|WP_162549509.1\|2269236_2269980_+\|CRISPR-system-precrRNA-processing-endoribonuclease-RAMP-protein-Cas6	gnl\|CDD\|337605	pfam10040, CRISPR_Cas6, CRISPR-associated endoribonuclease Cas6. Cas6 is a member of the RAMP (repeat-associated mysterious protein) superfamily. It is among the most widely distributed Cas proteins and is found in both bacteria and archaea. Cas6 functions in the generation of CRISPR-derived guide RNAs for invader defense in prokaryotes.	0.00236056
NZ_AP017372.2\|WP_096410053.1\|2263122_2264055_+\|acetoin-utilization-protein-AcuC	gnl\|CDD\|212520	cd09994, HDAC_AcuC_like, Class I histone deacetylase AcuC (Acetoin utilization protein)-like enzymes. AcuC (Acetoin utilization protein) is a class I deacetylase found only in bacteria and is involved in post-translational control of the acetyl-coenzyme A synthetase (AcsA). Deacetylase AcuC works in coordination with deacetylase SrtN (class III), possibly to maintain AcsA in active (deacetylated) form and let the cell grow under low concentration of acetate. B. subtilis AcuC is a member of operon acuABC; this operon is repressed by the presence of glucose and does not show induction by acetoin; acetoin is a bacterial fermentation product that can be converted to acetate via the butanediol cycle in absence of other carbon sources. Inactivation of AcuC leads to slower growth and lower cell yield under low-acetate conditions in Bacillus subtilis. In general, Class I histone deacetylases (HDACs) are Zn-dependent enzymes that catalyze hydrolysis of N(6)-acetyl-lysine residues in histone amino termini to yield a deacetylated histone (EC 3.5.1.98). Enzymes belonging to this group participate in regulation of a number of processes through protein (mostly different histones) modification (deacetylation). Class I histone deacetylases in general act via the formation of large multiprotein complexes. Members of this class are involved in cell cycle regulation, DNA damage response, embryonic development, cytokine signaling important for immune response and in posttranslational control of the acetyl coenzyme A synthetase.	3.39207e-116
NZ_AP017372.2\|WP_096410063.1\|2273873_2274869_+\|type-III-A-CRISPR-associated-RAMP-protein-Csm4	gnl\|CDD\|187794	cd09663, Csm4_III-A, CRISPR/Cas system-associated RAMP superfamily protein Csm4. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; RAMP superfamily protein.	5.9536e-26
NZ_AP017372.2\|WP_096410052.1\|2261964_2262939_+\|L,D-transpeptidase-family-protein	gnl\|CDD\|182294	PRK10190, PRK10190, L,D-transpeptidase; Provisional.	3.78572e-43
NZ_AP017372.2\|WP_096410049.1\|2257731_2259141_+\|DUF262-domain-containing-protein	gnl\|CDD\|377008	pfam03235, DUF262, Protein of unknown function DUF262.	1.80949e-28
NZ_AP017372.2\|WP_162549507.1\|2264182_2264623_-\|DUF488-domain-containing-protein	gnl\|CDD\|377317	pfam04343, DUF488, Protein of unknown function, DUF488. This family includes several proteins of uncharacterized function.	1.13293e-22
NZ_AP017372.2\|WP_096410064.1\|2274869_2276369_+\|hypothetical-protein	gnl\|CDD\|187793	cd09662, Csm5_III-A, CRISPR/Cas system-associated RAMP superfamily protein Csm5. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; RAMP superfamily protein.	2.40793e-20
NZ_AP017372.2\|WP_096410061.1\|2272603_2273053_+\|type-III-A-CRISPR-associated-protein-Csm2	gnl\|CDD\|367635	pfam03750, Csm2_III-A, Csm2 Type III-A. Clusters of short DNA repeats with non-homologous spacers, which are found at regular intervals in the genomes of phylogenetically distinct prokaryotic species, comprise a family with recognisable features. This family is known as CRISPR (short for Clustered Regularly Interspaced Short Palindromic Repeats). A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-associated) proteins. This entry represents Csm2 Type III-A, a family of Cas proteins also known as TM1810/Csm2.	1.55281e-27
NZ_AP017372.2\|WP_096410050.1\|2259133_2261071_+\|DUF262-domain-containing-protein	gnl\|CDD\|377008	pfam03235, DUF262, Protein of unknown function DUF262.	2.64983e-25

>NZ_AP017372.2|WP_096410056.1|2265315_2265723_-|YjbQ-family-protein
MRKTITVTTHQREELVDITEPIRRAVAEAEVSDGLLALYVQGATAAIMIQENWDASVPRDAVNLLQQLVPRGVWEHDSQDGNGDSHLKAGLIGPSETIPIINSKMGLSTWQGIFLACEFDGPRRERTVVCTLIAM
>NZ_AP017372.2|WP_096410055.1|2264730_2265279_-|peptide-methionine-(S)-S-oxide-reductase-MsrA
MRVSRSITVGGGCFWCIEGVFQQLPAVHQAISGYAGGESPDPSYREVCSGRTGHAEVVQVNFDPEQVEERALMELFFAIHDPTLHNRQGPDVGSQYRSIILYADKEQRQTAEAVIKEIGAAGEYSAPIVTELVPLTTFYPAEEMHQRYYEAAPEAPYCRSMIAPKIAKARERFPRLFDGWAN
>NZ_AP017372.2|WP_162549507.1|2264182_2264623_-|DUF488-domain-containing-protein
MHTLYTTGYERTDLDTFIVTLQRASVATVIDVRASPHSRRREFAFKHLARELPGAGIGYESWPVLGAPQAARDAAKVGDAQRFYQLYASHLEEPKPKDALHSLAERAVTEAVALLCYERDPAECHRLLIAERLERSHKLASHHLAG
>NZ_AP017372.2|WP_096410053.1|2263122_2264055_+|acetoin-utilization-protein-AcuC
MTGVPLRIATDKRLGAYHFGPGHPFGPGRMAAFLEALDELELAYEALPLAEADTATLTRFHAREYVERVQSLAGTGAPLDLGDTPAVPGIDGAAKRVVGTVAAAVDDLLAGRVRRAFVPIAGLHHGQRDRASGFCVYNDCGVALETLLAAGVAPVAYVDIDVHHGDGVYDSFETDPRVIFADIHQDGRTLFPGTGAAEAQGKGAAHGTKLNVPLPPGADDDAFVEAWERIEAHLERHQPKVIVMQCGADGLAGDPLASLRYTSKTHASAARRLRVLTERWAEGRLLALGGGGYDLSNIAAAWTAVVREIA
>NZ_AP017372.2|WP_096410052.1|2261964_2262939_+|L,D-transpeptidase-family-protein
MWLCSPTICTAAAAALLAPALAGPSTASAGPGDRERALHRYEAPAQVEVVGGVYHVPVKPDEALAEVAEREGVGVERLRAANPHTATENASERALRIPARHVLPDTPREGLVIDVAGMRLFHYPEETDAVEVFPISTGREGWPTPVAMKTEVAERLENPAWYPPESIRDSRAASDESGSLPRMVPPGAENPLGEHVLILEVDGYLVHGTNEPHSIGERTSHGCARMHPQDIEHLFERVKAGTPVRFVDQPFRIGRSARGEVWVESHPSAPDGSNPELDRRFVRALPDIAGEGVAINGARLIEAVNDQDGIAVRVSVGEEGAGKR
>NZ_AP017372.2|WP_096410051.1|2261526_2261805_+|hypothetical-protein
MLQRKLDSAHQERNQAEHERHRLEKDYASLQSQVDRHKERIEQLQAEVMQERERHQEAQELARYHQEQSQALMEVLRRGDGTGEEMEGGGYS
>NZ_AP017372.2|WP_162549506.1|2261142_2261535_-|hypothetical-protein
MQHFRFLLELIFELLGALLVAVSLVGDLIGALSEKGKNRTLGQLQRPYSPELARAGLKVTKQSGHKGSCKPKMTGSEFESVKKLLARGVPPNHVAKALGRCTAGRRRQRMLSVRFFPFSERAPTGVSNST
>NZ_AP017372.2|WP_096410050.1|2259133_2261071_+|DUF262-domain-containing-protein
MDNCVLTQVQAPAAILDEDIAFVIPSYQRPYVWPDDAVVKLFDDIFRAWQWDACSNYYIGTVLTAPISHIEGAAYELIDGQQRITTLMLIALAFRVTGQETALNPLAERGNAPRLTFAIREQVQALLGYWSGLDGYQYPGEDAVKTNPYLTRLDDALNVLKQLVGAIEKDRRIELAGYIHTNVQWVNNTMPGSMDLNRLFATMNTRGVQLEQSDILKSMLLRRISTDKSRYEAIWQACEQMDNYFERNVRQIFGGTDWSDMLPEHLRHFDPARFLLSEEQNLEAERPGSGLTISQLADSSYPDENEGSSALDLDDTVYCQSIIGFPLLLMHALRIYTARSGYADIGGRLHSERLIDSFSVLVDASETEVKEFVECLWEVRYQFDRWVVKWVERSDEDERQLRLTDINRSPSNGNWYLTRSVKKLFELVPLQSVRHFTGEHSAQYWLTPFLGLLCMETNPSENTVLDIMERIDNQLSLAEASQKQASFELLSGDVSAQRSVAAIIEYLKTPCGTKFEHYWFQKLEYLLWKRDHSQDEKVLNYRIVSRNSIEHVYAQNEEFKNEMKRDYLDAFGNLVLLNPSENSSYGYQSVNKKKADFKDRSHYNGSYDSLKLKEIFSLMGQGEWSPNLVEAHQEAMFELISCHYS
>NZ_AP017372.2|WP_096410049.1|2257731_2259141_+|DUF262-domain-containing-protein
MTVVVASCTVAKLFSGETFEASDGTLIEGNLHLPEYQRPYRWGEAQIRRLLEDLRRYFCPPHPGSSPAHLFYLGSIILHQDGEGRLNIIDGQQRLTTMALLMWQQAPGSEPKLRYESPLSHAQIRKNQEWLKQQENWNRAWLKLERINITVVVTRSEDDAYCFFETQNTGGVRLSGPDIIKAHHLRATPRSRQDRYARLWESLGDLNPVVDAVLKARSWNALNFRHVPSRREPLSVRETVVTELAENTGEGHADVAYGLTATSRTPDGAVVQVAHADGYAMRQPLNAGINSIHYLEYFESLRRILLTNHREPDLDSFHNFYQGLIVGRQGCSYLKKLYDSCLLLYASHFGRSQLFEASLRLFRVVYAPRVTNEKTVKEATASKFVRENPVFDWILMSYTHEQCMERLRLFEVKVSAKNLGQSDDGVKKRFVQAVNEWFSLELPKDRMAEQYDDALQKAIKSTLEVVNHG
>NZ_AP017372.2|WP_162549505.1|2257333_2257504_-|hypothetical-protein
MATPYEKLKSLANAEQYLKPGVTFKQLDEIAYAICDNEAARQLNEGSSQKTEKIVR
>NZ_AP017372.2|WP_096410057.1|2267048_2267339_-|CRISPR-associated-protein-Csx16
MTTWFVSRHPGAAAWAERQGIEVDRFVEHLDWAAVERGDAVIGTLPVHIAAMICQRGAAYWHLSLELPLDMRGKELSEDDMELAGARIERFHVEKK
>NZ_AP017372.2|WP_096410058.1|2267478_2268606_+|TIGR02584-family-CRISPR-associated-protein
MATEGKNTLLCIAGLTPQVVTETLYAITIESQGALPDRLEIITTTEGRRRLLLTLLSKDGGHGYLDRFYQDYGLDRANLAFDESCVHVIHGLDGEPLADIVTEQDNCAAADLIHERIRQLTQQTQKLHVSIAGGRKTMGFYAGYSLSLYARPSDRLSHVLVNAPFESHPSFFYPPPQPLTLQLPGRNDIISTAEAQVRLADLPFVRLREELGEDLPYAGLSFSEAVERAQQVITPAQLALDLAERTANLQGQVIKLSPTHFVWLTWFADRARREKPPLRFDHEAAKELERYIDWLDGSNSPLHESLHSAREELESEGCSNYFERTRSRLNKALAERSGLPARAVARYQIHACSNRPQSTYALRLTPEQIRMVGEP
>NZ_AP017372.2|WP_162549508.1|2268630_2268822_-|hypothetical-protein
MLIHKMLKAYPPVVPQHQEGLPGMHVCLERLANMDPEGHNIHSIVLRMHEPILIGQMVAQQQL
>NZ_AP017372.2|WP_162549509.1|2269236_2269980_+|CRISPR-system-precrRNA-processing-endoribonuclease-RAMP-protein-Cas6
MVKWQARYPKAPHPFVLGLSLNSGGQVSAGEKLSLGVTLLGRATGTIPYWVHVLQAAGEQGLGPQRVPLALETVHQECGPGDGDWALVYLPGETFEPQPAQHPKPPPVPNRVRLRLHTPLRVRRGGRHVSAQELAFHDLFRTLLRRLSMLSQFHGPGPLEGDPRTLVEIARGIAWQKTDWRWHDWQRFSARQGRRVPMGGVIGEALLDGNDLVFIWSLLWFGQWVHASRGASMGLGRYEIISEDAIS
>NZ_AP017372.2|WP_096410060.1|2269976_2272607_+|type-III-A-CRISPR-associated-protein-Cas10/Csm1
MSTEQIKTSWRTQDHVVLGALIHDIGKLFERGDLLDSYRNDEDMLQAYCPFQIRGRYFSHKHAVHTLAWAERLAERIPALDPEHLGIGTDHWLNLAARHHKPSSALEALIKRADDLASQERDPLGIDARFISRKVRLEPILERVTLEADPGRARTTETRVPLTPMEPGSPYFPEHAHKMDPPMNWDREKCAWVSQQDLGDAYARLGQDLLGQLEQLPTAEAPPSAIIGTLLTLLERYTAQVPSATNTAHPDISLFDHLRVTAAIAEGLYTYHQDQGDGLENVEKRDQTAKWALVCGDLSGIQRFIYRITSRGAARALRGRSLYLQLLTDGLASRMRRELDLHAPAQIYASGGKFFLLIPSTRVDQARQVAATINDELLAPFQGQLRLGLGTAHLAPNHFRAGHMGERWQATIDDLHRDRTRPWAGRMAHPPEKEDQDFFAPESPSEDGHCHACGRDDPPGDICDRGEGRRLCQQCNDLEQLGLAIRHASAITWHEPGTQRRGWELPGTGRVIRLPSREDPESLPLAAGDVLERLEGWPELAEARPGIAYSARFIGRWQESCGESELEELAASSQGIKRLGILRMDVDNLGQIFARGLRFGSTTETESSADMGSLSRTATLSRQLHWFFSTHLTRLLEQAEAPAQIMYAGGDDLFIVGAWHAMPELAVRIQHDLQRFASHNPVFSLSGGIELVGGRYPIGHAAELAGIQEEHAKGHRRSDKEGQTRDKCALAFLHTPVGWEQMEHVEGVREQLERFLEATGNRAVLGYLRRAVADMEGLQRRYAQGRWSDTELHALVEAQRWRWQLLSRLRRLRRRHQHHTEAVGAIDRLQEVFIEQQQPHKPPDPHLLGLPGRWVELKYRQSGNYLPDRGEEVHAP
>NZ_AP017372.2|WP_096410061.1|2272603_2273053_+|type-III-A-CRISPR-associated-protein-Csm2
MNAANANHPRHKQQGPSGSDPATIRGFIEDDQADQLVATAERLGQDMGKQVSTSQVRNIFSSIKRLEMREQQHSPSGDAPLSPNVRRELLLLKPRLAYATARENRLKPLHDAVTTALDVVAQQGDQNALRRLSAFYEAIVAYHQYHGGK
>NZ_AP017372.2|WP_096410062.1|2273055_2273859_+|type-III-A-CRISPR-associated-RAMP-protein-Csm3
MTDVSQYATLQSKVFLRGELRAETGLHIGGSETGLGIGGADSVVVRDPLDHTPYVPGSSLRGKLRSLLERARGLEGANGNAEGGFALGKNNAGVPGRDPSTALAQLFGITADQNARGPSRLIVRDARLTPDSYQALMDAPGTDMPMTEVKTEVSIDRITSAAMPRQLERVPAGARFDFELVITVMVADDRQQWLNLILEGLDLLQDDTLGGNGSRGYGRISVDLRELLERDSQAYREGREAIPITDLDIPPALQGHPEATSPSTATA
>NZ_AP017372.2|WP_096410063.1|2273873_2274869_+|type-III-A-CRISPR-associated-RAMP-protein-Csm4
MRCYRLHFRAPLHIDDRGTGYYEASDPFVRSDTVSAALLTTWGQLDPENATARAAKPPFRVSSAMPWLEGTPLLPRPVPHRAAPAPQGDPALAKVTKGVQWLSPRLWHRIWHEGWQQALHPDTVCTPQKEIALARDEASEPSPAWAQERRPRLNVDRITDGPVEGQLFEFGRIHFLPSAGLYLLAEHADETARQGFEAALSLLGDTGLGADRNAGNGQFTWEPAADFQERLGVRQTEPGESGVLVSLANPGLSERQWAGDERSAYDITTRGGWIANYGIRRARVRMLTEGSFLSVTIQGRVLDVTPRALASELPHPIYRDGRALMLRPEEG
>NZ_AP017372.2|WP_096410064.1|2274869_2276369_+|hypothetical-protein
MTDIRGARPETENVCIEVVTPLHIGDGESLIKDADFVQERPGHPFRVIDKAGLERRLAEQGGDEVEAYLAHQEMPGLQDLVTLAGGASHAPGYDLPPHEPGHAPASPEIRSTIKDAWLRPLLPGSALKGALRTAWIAQHLRDQVIQPRAQELNKPPRFAAARFLGRLTSAPAHAGSGRPGPNSDAFRVLRPRDAQAPRSALSWVDIRIAKSPRDGKVGWHVTTRSGRRQVDDWSQATALNAEALAPGTVLATQISWDGLLCANESAWRATGNEHIALPRGFCELRDVLIRHARHQIQREKKDLFAWELKAAYRTWQQLEQQLEQAIQQGGAPLRLGFGIGWLGMTGDWLSDETFHTVLAETHWKVKQPHRFPKTRRLVVERGQPQAPLGWVILWPADSGPPPTGQDPEEQKDREDPGDAGHPWVNTKIAELQKAHNSSLEEVLRGKKLAQACQLIDDLETRSEVLADIRRRWQERGWWNDPRGRAMKQARQIYGELTGE
>NZ_AP017372.2|WP_162549510.1|2277575_2278202_+|CRISPR-system-precrRNA-processing-endoribonuclease-RAMP-protein-Cas6
MLNPALRWMPTLLPVLHNLQLKRSKLKLQRISLVNTDGLAASGADNKINVTAEELLKINELATPQHPPHPPEFITIRVQQHPLRLRRKNRYVGSEQFDPGVFISALLRRASMLNSITSQATETDFRYLTQLGRSIGLNRSELHWFDWHRHSTPQDRRVPMGGLLGEFQLDSVPEEIWPWVWLGQWLHVGKGAVMGMGRYQLAEYAADN

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_AP017372_10

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_AP017372_10

2276804-2277052

TypeIII

Consensus_repeat	Method
AGTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	PILER-CR
AGTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	CRT

3 spacers

csm5gr7,csm4gr5,csm3gr7,csm2gr11,cas10,cas6,csx1,csx16,cas2,cas1

The CRISPR arrays of NZ_AP017372_10

>merge|NZ_AP017372|10|2276804-2277052|PILER-CR,CRT
AGTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGACGTTTCCTGAGCGTTGGCTCCGCAGTCGCAGCAGAGTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGACCCCCGTGACATAGAACATTGCAATTGGTTGAGTAAGTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGACGATCTGTATCTTGAATGGGCACTCCCACCCGACCAGTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAAAC

>NZ_AP017372|10|7|2276804-2276981|PILER-CR
AGTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	GTTTCCTGAGCGTTGGCTCCGCAGTCGCAGCAG
AGTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	CCCCGTGACATAGAACATTGCAATTGGTTGAGTA
AGTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC

>NZ_AP017372|10|4|2276804-2277052|CRT
AGTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	GTTTCCTGAGCGTTGGCTCCGCAGTCGCAGCAG
AGTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	CCCCGTGACATAGAACATTGCAATTGGTTGAGTA
AGTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	GATCTGTATCTTGAATGGGCACTCCCACCCGACC
AGTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAAAC

Protein	Signature genes	Signature genes Name	Protein_function
NZ_AP017372.2\|WP_096410060.1\|2269976_2272607_+\|type-III-A-CRISPR-associated-protein-Cas10/Csm1	cas10	cd09680_cas10_CAS-III	gnl\|CDD\|187811
NZ_AP017372.2\|WP_096410070.1\|2282532_2282814_+\|CRISPR-associated-endonuclease-Cas2	cas2	pfam09827_cas2_CAS-I:CAS-II:CAS-III	gnl\|CDD\|187856
NZ_AP017372.2\|WP_096410062.1\|2273055_2273859_+\|type-III-A-CRISPR-associated-RAMP-protein-Csm3	csm3gr7	cd09684_csm3gr7_CAS-III-A:CAS-III-D	gnl\|CDD\|187815
NZ_AP017372.2\|WP_162549508.1\|2268630_2268822_-\|hypothetical-protein	unknown	unknown	unknown
NZ_AP017372.2\|WP_096410056.1\|2265315_2265723_-\|YjbQ-family-protein	unknown	unknown	gnl\|CDD\|223509
NZ_AP017372.2\|WP_096410061.1\|2272603_2273053_+\|type-III-A-CRISPR-associated-protein-Csm2	csm2gr11	pfam03750_csm2gr11_CAS-III-A	gnl\|CDD\|367635
NZ_AP017372.2\|WP_096410074.1\|2285021_2285252_+\|helix-turn-helix-transcriptional-regulator	unknown	unknown	gnl\|CDD\|197775
NZ_AP017372.2\|WP_096410058.1\|2267478_2268606_+\|TIGR02584-family-CRISPR-associated-protein	csx1	pfam09623_csx1_CAS-III	gnl\|CDD\|187872
NZ_AP017372.2\|WP_162549509.1\|2269236_2269980_+\|CRISPR-system-precrRNA-processing-endoribonuclease-RAMP-protein-Cas6	cas6	mkCas0066_cas6_CAS-I:CAS-III	gnl\|CDD\|337605
NZ_AP017372.2\|WP_162549510.1\|2277575_2278202_+\|CRISPR-system-precrRNA-processing-endoribonuclease-RAMP-protein-Cas6	cas6	mkCas0066_cas6_CAS-I:CAS-III	gnl\|CDD\|337605
NZ_AP017372.2\|WP_096410057.1\|2267048_2267339_-\|CRISPR-associated-protein-Csx16	csx16	pfam09652_csx16_CAS-I:CAS-III	gnl\|CDD\|370601
NZ_AP017372.2\|WP_096410068.1\|2279594_2280182_-\|NUDIX-domain-containing-protein	unknown	unknown	gnl\|CDD\|226597
NZ_AP017372.2\|WP_096410063.1\|2273873_2274869_+\|type-III-A-CRISPR-associated-RAMP-protein-Csm4	csm4gr5	COG1567_csm4gr5_CAS-III-A	gnl\|CDD\|187794
NZ_AP017372.2\|WP_096410067.1\|2278248_2279460_+\|TIGR02221-family-CRISPR-associated-protein	csx1	cd09732_csx1_CAS-III	gnl\|CDD\|187799
NZ_AP017372.2\|WP_096410064.1\|2274869_2276369_+\|hypothetical-protein	csm5gr7	cd09662_csm5gr7_CAS-III-A	gnl\|CDD\|187793
NZ_AP017372.2\|WP_162549511.1\|2286555_2286975_-\|hypothetical-protein	unknown	unknown	unknown
NZ_AP017372.2\|WP_096410072.1\|2283620_2283932_+\|CRISPR-associated-endonuclease-Cas2	cas2	pfam09827_cas2_CAS-I:CAS-II:CAS-III	gnl\|CDD\|378256
NZ_AP017372.2\|WP_096410071.1\|2282827_2283628_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|376633
NZ_AP017372.2\|WP_096410073.1\|2284042_2285029_+\|CRISPR-associated-endonuclease-Cas1	cas1	cd09634_cas1_CAS-I:CAS-II:CAS-III:CAS-V	gnl\|CDD\|376633
NZ_AP017372.2\|WP_096410069.1\|2280181_2282353_-\|hypothetical-protein	csx1	cd09741_csx1_CAS-III	gnl\|CDD\|236480

Protein	Cas_name	Cas_description	E-value	Identity	Coverage
NZ_AP017372.2\|WP_096410060.1\|2269976_2272607_+\|type-III-A-CRISPR-associated-protein-Cas10/Csm1	cas10	cd09680_cas10_CAS-III	2.9e-119	394.1	0.0
NZ_AP017372.2\|WP_096410070.1\|2282532_2282814_+\|CRISPR-associated-endonuclease-Cas2	cas2	pfam09827_cas2_CAS-I:CAS-II:CAS-III	3.7e-13	44.4	0.0
NZ_AP017372.2\|WP_096410062.1\|2273055_2273859_+\|type-III-A-CRISPR-associated-RAMP-protein-Csm3	csm3gr7	cd09684_csm3gr7_CAS-III-A:CAS-III-D	3.7e-67	220.9	0.0
NZ_AP017372.2\|WP_096410063.1\|2273873_2274869_+\|type-III-A-CRISPR-associated-RAMP-protein-Csm4	csm4gr5	COG1567_csm4gr5_CAS-III-A	2.6e-29	97.1	0.0
NZ_AP017372.2\|WP_096410061.1\|2272603_2273053_+\|type-III-A-CRISPR-associated-protein-Csm2	csm2gr11	pfam03750_csm2gr11_CAS-III-A	2.9e-26	86.9	0.0
NZ_AP017372.2\|WP_096410058.1\|2267478_2268606_+\|TIGR02584-family-CRISPR-associated-protein	csx1	pfam09623_csx1_CAS-III	9.6e-80	262.2	0.0
NZ_AP017372.2\|WP_162549509.1\|2269236_2269980_+\|CRISPR-system-precrRNA-processing-endoribonuclease-RAMP-protein-Cas6	cas6	mkCas0066_cas6_CAS-I:CAS-III	3.5e-71	234.8	0.6
NZ_AP017372.2\|WP_162549510.1\|2277575_2278202_+\|CRISPR-system-precrRNA-processing-endoribonuclease-RAMP-protein-Cas6	cas6	mkCas0066_cas6_CAS-I:CAS-III	7.3e-43	141.7	0.2
NZ_AP017372.2\|WP_096410057.1\|2267048_2267339_-\|CRISPR-associated-protein-Csx16	csx16	pfam09652_csx16_CAS-I:CAS-III	6.2e-38	123.7	0.0
NZ_AP017372.2\|WP_096410067.1\|2278248_2279460_+\|TIGR02221-family-CRISPR-associated-protein	csx1	cd09732_csx1_CAS-III	9.6e-47	154.7	0.0
NZ_AP017372.2\|WP_096410064.1\|2274869_2276369_+\|hypothetical-protein	csm5gr7	cd09662_csm5gr7_CAS-III-A	1.2e-19	65.5	0.0
NZ_AP017372.2\|WP_096410072.1\|2283620_2283932_+\|CRISPR-associated-endonuclease-Cas2	cas2	pfam09827_cas2_CAS-I:CAS-II:CAS-III	9.3e-21	68.8	0.0
NZ_AP017372.2\|WP_096410073.1\|2284042_2285029_+\|CRISPR-associated-endonuclease-Cas1	cas1	cd09634_cas1_CAS-I:CAS-II:CAS-III:CAS-V	1.7e-63	209.3	0.0
NZ_AP017372.2\|WP_096410069.1\|2280181_2282353_-\|hypothetical-protein	csx1	cd09741_csx1_CAS-III	6.3e-13	43.5	0.3

Protein	Function_ID	Function_description	E-value
NZ_AP017372.2\|WP_096410060.1\|2269976_2272607_+\|type-III-A-CRISPR-associated-protein-Cas10/Csm1	gnl\|CDD\|187811	cd09680, Cas10_III, CRISPR/Cas system-associated protein Cas10. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Multidomain protein with permuted HD nuclease domain, palm domain and Zn-ribbon; signature gene for type III; also known as Csm1 family.	7.95833e-114
NZ_AP017372.2\|WP_096410070.1\|2282532_2282814_+\|CRISPR-associated-endonuclease-Cas2	gnl\|CDD\|187856	cd09725, Cas2_I_II_III, CRISPR/Cas system-associated protein Cas2. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas2 is present in majority of CRISPR/Cas systems along with Cas1; RNAse specific to U-rich regions; Possesses an RRM/ferredoxin fold.	3.08801e-07
NZ_AP017372.2\|WP_096410062.1\|2273055_2273859_+\|type-III-A-CRISPR-associated-RAMP-protein-Csm3	gnl\|CDD\|187815	cd09684, Csm3_III-A, CRISPR/Cas system-associated RAMP superfamily protein Csm3. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; RAMP superfamily protein.	3.25432e-74
NZ_AP017372.2\|WP_096410056.1\|2265315_2265723_-\|YjbQ-family-protein	gnl\|CDD\|223509	COG0432, COG0432, Uncharacterized conserved protein [Function unknown].	3.13581e-48
NZ_AP017372.2\|WP_096410061.1\|2272603_2273053_+\|type-III-A-CRISPR-associated-protein-Csm2	gnl\|CDD\|367635	pfam03750, Csm2_III-A, Csm2 Type III-A. Clusters of short DNA repeats with non-homologous spacers, which are found at regular intervals in the genomes of phylogenetically distinct prokaryotic species, comprise a family with recognisable features. This family is known as CRISPR (short for Clustered Regularly Interspaced Short Palindromic Repeats). A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-associated) proteins. This entry represents Csm2 Type III-A, a family of Cas proteins also known as TM1810/Csm2.	1.55281e-27
NZ_AP017372.2\|WP_096410074.1\|2285021_2285252_+\|helix-turn-helix-transcriptional-regulator	gnl\|CDD\|197775	smart00530, HTH_XRE, Helix-turn-helix XRE-family like proteins.	8.55439e-05
NZ_AP017372.2\|WP_096410058.1\|2267478_2268606_+\|TIGR02584-family-CRISPR-associated-protein	gnl\|CDD\|187872	cd09741, Csx1_III-U, CRISPR/Cas system-associated protein Csx1. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Protein of this family often fused to HTH domain; Some proteins could have an additional fusion with RecB-family nuclease domain; Core domain appears to have a Rossmann-like fold; loosely associated with CRISPR/Cas systems; also known as NE0113 family.	2.55477e-89
NZ_AP017372.2\|WP_162549509.1\|2269236_2269980_+\|CRISPR-system-precrRNA-processing-endoribonuclease-RAMP-protein-Cas6	gnl\|CDD\|337605	pfam10040, CRISPR_Cas6, CRISPR-associated endoribonuclease Cas6. Cas6 is a member of the RAMP (repeat-associated mysterious protein) superfamily. It is among the most widely distributed Cas proteins and is found in both bacteria and archaea. Cas6 functions in the generation of CRISPR-derived guide RNAs for invader defense in prokaryotes.	0.00236056
NZ_AP017372.2\|WP_162549510.1\|2277575_2278202_+\|CRISPR-system-precrRNA-processing-endoribonuclease-RAMP-protein-Cas6	gnl\|CDD\|337605	pfam10040, CRISPR_Cas6, CRISPR-associated endoribonuclease Cas6. Cas6 is a member of the RAMP (repeat-associated mysterious protein) superfamily. It is among the most widely distributed Cas proteins and is found in both bacteria and archaea. Cas6 functions in the generation of CRISPR-derived guide RNAs for invader defense in prokaryotes.	1.68563e-07
NZ_AP017372.2\|WP_096410057.1\|2267048_2267339_-\|CRISPR-associated-protein-Csx16	gnl\|CDD\|370601	pfam09652, Cas_VVA1548, Putative CRISPR-associated protein (Cas_VVA1548). This entry represents a conserved region of about 95 amino acids found exclusively in species with CRISPRs (Clustered Regularly Interspaced Short Palindromic Repeats). In all bacterial species that contain this entry, the genes encoding the proteins are in the midst of a cluster of cas (CRISPR-associated) genes.	8.56222e-41
NZ_AP017372.2\|WP_096410068.1\|2279594_2280182_-\|NUDIX-domain-containing-protein	gnl\|CDD\|226597	COG4112, COG4112, Predicted phosphoesterase (MutT family) [General function prediction only].	2.34312e-23
NZ_AP017372.2\|WP_096410063.1\|2273873_2274869_+\|type-III-A-CRISPR-associated-RAMP-protein-Csm4	gnl\|CDD\|187794	cd09663, Csm4_III-A, CRISPR/Cas system-associated RAMP superfamily protein Csm4. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; RAMP superfamily protein.	5.9536e-26
NZ_AP017372.2\|WP_096410067.1\|2278248_2279460_+\|TIGR02221-family-CRISPR-associated-protein	gnl\|CDD\|187799	cd09668, Csx1_III-U, CRISPR/Cas system-associated protein Csx1. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Protein of this family often fused to HTH domain; Some proteins could have an additional fusion with RecB-family nuclease domain; Core domain appears to have a Rossmann-like fold; loosely associated with CRISPR/Cas systems; also known as TM1812 family.	3.09173e-34
NZ_AP017372.2\|WP_096410064.1\|2274869_2276369_+\|hypothetical-protein	gnl\|CDD\|187793	cd09662, Csm5_III-A, CRISPR/Cas system-associated RAMP superfamily protein Csm5. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; RAMP superfamily protein.	2.40793e-20
NZ_AP017372.2\|WP_096410072.1\|2283620_2283932_+\|CRISPR-associated-endonuclease-Cas2	gnl\|CDD\|378256	pfam09827, CRISPR_Cas2, CRISPR associated protein Cas2. Members of this family of bacterial proteins comprise various hypothetical proteins, as well as CRISPR (clustered regularly interspaced short palindromic repeats) associated proteins, conferring resistance to infection by certain bacteriophages.	7.26681e-17
NZ_AP017372.2\|WP_096410071.1\|2282827_2283628_+\|hypothetical-protein	gnl\|CDD\|376633	pfam01867, Cas_Cas1, CRISPR associated protein Cas1. Clustered regularly interspaced short palindromic repeats (CRISPRs) are a family of DNA direct repeats found in many prokaryotic genomes. This family of proteins corresponds to Cas1, a CRISPR-associated protein. Cas1 may be involved in linking DNA segments to CRISPR.	0.00202765
NZ_AP017372.2\|WP_096410073.1\|2284042_2285029_+\|CRISPR-associated-endonuclease-Cas1	gnl\|CDD\|376633	pfam01867, Cas_Cas1, CRISPR associated protein Cas1. Clustered regularly interspaced short palindromic repeats (CRISPRs) are a family of DNA direct repeats found in many prokaryotic genomes. This family of proteins corresponds to Cas1, a CRISPR-associated protein. Cas1 may be involved in linking DNA segments to CRISPR.	2.49257e-71
NZ_AP017372.2\|WP_096410069.1\|2280181_2282353_-\|hypothetical-protein	gnl\|CDD\|236480	PRK09358, PRK09358, adenosine deaminase; Provisional.	1.68612e-58

>NZ_AP017372.2|WP_096410064.1|2274869_2276369_+|hypothetical-protein
MTDIRGARPETENVCIEVVTPLHIGDGESLIKDADFVQERPGHPFRVIDKAGLERRLAEQGGDEVEAYLAHQEMPGLQDLVTLAGGASHAPGYDLPPHEPGHAPASPEIRSTIKDAWLRPLLPGSALKGALRTAWIAQHLRDQVIQPRAQELNKPPRFAAARFLGRLTSAPAHAGSGRPGPNSDAFRVLRPRDAQAPRSALSWVDIRIAKSPRDGKVGWHVTTRSGRRQVDDWSQATALNAEALAPGTVLATQISWDGLLCANESAWRATGNEHIALPRGFCELRDVLIRHARHQIQREKKDLFAWELKAAYRTWQQLEQQLEQAIQQGGAPLRLGFGIGWLGMTGDWLSDETFHTVLAETHWKVKQPHRFPKTRRLVVERGQPQAPLGWVILWPADSGPPPTGQDPEEQKDREDPGDAGHPWVNTKIAELQKAHNSSLEEVLRGKKLAQACQLIDDLETRSEVLADIRRRWQERGWWNDPRGRAMKQARQIYGELTGE
>NZ_AP017372.2|WP_096410063.1|2273873_2274869_+|type-III-A-CRISPR-associated-RAMP-protein-Csm4
MRCYRLHFRAPLHIDDRGTGYYEASDPFVRSDTVSAALLTTWGQLDPENATARAAKPPFRVSSAMPWLEGTPLLPRPVPHRAAPAPQGDPALAKVTKGVQWLSPRLWHRIWHEGWQQALHPDTVCTPQKEIALARDEASEPSPAWAQERRPRLNVDRITDGPVEGQLFEFGRIHFLPSAGLYLLAEHADETARQGFEAALSLLGDTGLGADRNAGNGQFTWEPAADFQERLGVRQTEPGESGVLVSLANPGLSERQWAGDERSAYDITTRGGWIANYGIRRARVRMLTEGSFLSVTIQGRVLDVTPRALASELPHPIYRDGRALMLRPEEG
>NZ_AP017372.2|WP_096410062.1|2273055_2273859_+|type-III-A-CRISPR-associated-RAMP-protein-Csm3
MTDVSQYATLQSKVFLRGELRAETGLHIGGSETGLGIGGADSVVVRDPLDHTPYVPGSSLRGKLRSLLERARGLEGANGNAEGGFALGKNNAGVPGRDPSTALAQLFGITADQNARGPSRLIVRDARLTPDSYQALMDAPGTDMPMTEVKTEVSIDRITSAAMPRQLERVPAGARFDFELVITVMVADDRQQWLNLILEGLDLLQDDTLGGNGSRGYGRISVDLRELLERDSQAYREGREAIPITDLDIPPALQGHPEATSPSTATA
>NZ_AP017372.2|WP_096410061.1|2272603_2273053_+|type-III-A-CRISPR-associated-protein-Csm2
MNAANANHPRHKQQGPSGSDPATIRGFIEDDQADQLVATAERLGQDMGKQVSTSQVRNIFSSIKRLEMREQQHSPSGDAPLSPNVRRELLLLKPRLAYATARENRLKPLHDAVTTALDVVAQQGDQNALRRLSAFYEAIVAYHQYHGGK
>NZ_AP017372.2|WP_096410060.1|2269976_2272607_+|type-III-A-CRISPR-associated-protein-Cas10/Csm1
MSTEQIKTSWRTQDHVVLGALIHDIGKLFERGDLLDSYRNDEDMLQAYCPFQIRGRYFSHKHAVHTLAWAERLAERIPALDPEHLGIGTDHWLNLAARHHKPSSALEALIKRADDLASQERDPLGIDARFISRKVRLEPILERVTLEADPGRARTTETRVPLTPMEPGSPYFPEHAHKMDPPMNWDREKCAWVSQQDLGDAYARLGQDLLGQLEQLPTAEAPPSAIIGTLLTLLERYTAQVPSATNTAHPDISLFDHLRVTAAIAEGLYTYHQDQGDGLENVEKRDQTAKWALVCGDLSGIQRFIYRITSRGAARALRGRSLYLQLLTDGLASRMRRELDLHAPAQIYASGGKFFLLIPSTRVDQARQVAATINDELLAPFQGQLRLGLGTAHLAPNHFRAGHMGERWQATIDDLHRDRTRPWAGRMAHPPEKEDQDFFAPESPSEDGHCHACGRDDPPGDICDRGEGRRLCQQCNDLEQLGLAIRHASAITWHEPGTQRRGWELPGTGRVIRLPSREDPESLPLAAGDVLERLEGWPELAEARPGIAYSARFIGRWQESCGESELEELAASSQGIKRLGILRMDVDNLGQIFARGLRFGSTTETESSADMGSLSRTATLSRQLHWFFSTHLTRLLEQAEAPAQIMYAGGDDLFIVGAWHAMPELAVRIQHDLQRFASHNPVFSLSGGIELVGGRYPIGHAAELAGIQEEHAKGHRRSDKEGQTRDKCALAFLHTPVGWEQMEHVEGVREQLERFLEATGNRAVLGYLRRAVADMEGLQRRYAQGRWSDTELHALVEAQRWRWQLLSRLRRLRRRHQHHTEAVGAIDRLQEVFIEQQQPHKPPDPHLLGLPGRWVELKYRQSGNYLPDRGEEVHAP
>NZ_AP017372.2|WP_162549509.1|2269236_2269980_+|CRISPR-system-precrRNA-processing-endoribonuclease-RAMP-protein-Cas6
MVKWQARYPKAPHPFVLGLSLNSGGQVSAGEKLSLGVTLLGRATGTIPYWVHVLQAAGEQGLGPQRVPLALETVHQECGPGDGDWALVYLPGETFEPQPAQHPKPPPVPNRVRLRLHTPLRVRRGGRHVSAQELAFHDLFRTLLRRLSMLSQFHGPGPLEGDPRTLVEIARGIAWQKTDWRWHDWQRFSARQGRRVPMGGVIGEALLDGNDLVFIWSLLWFGQWVHASRGASMGLGRYEIISEDAIS
>NZ_AP017372.2|WP_162549508.1|2268630_2268822_-|hypothetical-protein
MLIHKMLKAYPPVVPQHQEGLPGMHVCLERLANMDPEGHNIHSIVLRMHEPILIGQMVAQQQL
>NZ_AP017372.2|WP_096410058.1|2267478_2268606_+|TIGR02584-family-CRISPR-associated-protein
MATEGKNTLLCIAGLTPQVVTETLYAITIESQGALPDRLEIITTTEGRRRLLLTLLSKDGGHGYLDRFYQDYGLDRANLAFDESCVHVIHGLDGEPLADIVTEQDNCAAADLIHERIRQLTQQTQKLHVSIAGGRKTMGFYAGYSLSLYARPSDRLSHVLVNAPFESHPSFFYPPPQPLTLQLPGRNDIISTAEAQVRLADLPFVRLREELGEDLPYAGLSFSEAVERAQQVITPAQLALDLAERTANLQGQVIKLSPTHFVWLTWFADRARREKPPLRFDHEAAKELERYIDWLDGSNSPLHESLHSAREELESEGCSNYFERTRSRLNKALAERSGLPARAVARYQIHACSNRPQSTYALRLTPEQIRMVGEP
>NZ_AP017372.2|WP_096410057.1|2267048_2267339_-|CRISPR-associated-protein-Csx16
MTTWFVSRHPGAAAWAERQGIEVDRFVEHLDWAAVERGDAVIGTLPVHIAAMICQRGAAYWHLSLELPLDMRGKELSEDDMELAGARIERFHVEKK
>NZ_AP017372.2|WP_096410056.1|2265315_2265723_-|YjbQ-family-protein
MRKTITVTTHQREELVDITEPIRRAVAEAEVSDGLLALYVQGATAAIMIQENWDASVPRDAVNLLQQLVPRGVWEHDSQDGNGDSHLKAGLIGPSETIPIINSKMGLSTWQGIFLACEFDGPRRERTVVCTLIAM
>NZ_AP017372.2|WP_162549510.1|2277575_2278202_+|CRISPR-system-precrRNA-processing-endoribonuclease-RAMP-protein-Cas6
MLNPALRWMPTLLPVLHNLQLKRSKLKLQRISLVNTDGLAASGADNKINVTAEELLKINELATPQHPPHPPEFITIRVQQHPLRLRRKNRYVGSEQFDPGVFISALLRRASMLNSITSQATETDFRYLTQLGRSIGLNRSELHWFDWHRHSTPQDRRVPMGGLLGEFQLDSVPEEIWPWVWLGQWLHVGKGAVMGMGRYQLAEYAADN
>NZ_AP017372.2|WP_096410067.1|2278248_2279460_+|TIGR02221-family-CRISPR-associated-protein
MHTLVSFIGRTRRPEQGYERIAYNFPDGAVQNGIAFIGNGVAQYTKPDRLVILGTSGSMWDQVIVDYPEVKLGEEKDLALSDSVDNQATTAEQLSEVAAALSETASFTVDLRLIPETPGMEQTWEILHTLVDATSGSDRLTIDITHGFRHLPMVAMMAALYRRTLDDSQSFSVDALWYAQLPPGAKEAEMHNIVGILALADWMEAIQHSRTTGDLSRVAELLREEAPEIAENLAQGSFKETIHQGTQARGPYRKARKTLSETTLPGPAGLFQPILEDQISWVDGQHLHVRQAAHARSALERKDYLRAALYGYEAFVTQLTREHHSIEQLDHHEKRKAASDAFAESCQGRSKEDPKCRAFHQLRQLRNALAHGDQPKHADVQAALHSPQALHKLLSEALDRLLP
>NZ_AP017372.2|WP_096410068.1|2279594_2280182_-|NUDIX-domain-containing-protein
MGKGKVLVVPRQDLPDSWLPHEGALRSTWGEVKEVISTAGTLWLERSQAEYDHAYKQLIAYVRLRDSQGSYAVYKRQGSEQRLHGLWSVGLGGHVDEGDCSAADDSDAAKALERAAYRELEEELNGFTPERLEFLGLINEEKTEVGLVHLGMVWEAVAGIDRPKPGAELGEMGWRSPGQLPEDELEYWSRLAMRL
>NZ_AP017372.2|WP_096410069.1|2280181_2282353_-|hypothetical-protein
MNTLVATLGTTWQVLPEIFAYTNPGAAPLYEHSSAAGDIQEERKDYGLRPVQSLWIITTEGGIEEWQNLCQWQQYLPEPIEMRCWYIKGIEELFTPGENRAMADLIYRVALHARLHTRRNNSCLYFALAGGRKTMSAELQQAAHLFGADALLHVVDRFAKQEREQFNSLSFQSLCQPLPKEFADSIRPLVTNGDLPGNEALLNSFQELDCEFEERFPLPGFGDQQRFSIESVPAQDDLHAWVKERQKRAEALLANYRLQVSAHEKLGNFRALYGLSPQTVEKLRQTRLGCDQHKQEQELAWLRRLPKAELHCHLGGILDSAGMIRVAEAMADDLAAEDRRNREFAIWRRDMETAIRSGNIPYLKSLLPGGSLSGKPLRDNFSVTQPLSVAALLYAFRDNPQLLDSLLYGVYQQPSQFTAVGIESYEELGNLQGSGLLQSEKTLRAAMAELGAICRRERIGYLELRCSPLNYVRGDLDKDDVVRILVEEAERIEDCDVRLLFIASRHRDPEQTKEHIELALHWFDNSKSFRERFVGFDLAGAEHAMQPAAMREYFLPLHERVVRMTIHAGEGERAENIWEAVYELSADRIGHGLTLKEYPDLIDRFRDRRIALEMCPSSNRQIRGYYHPHYSPQEERKYPLSSYLEAGLRVSINTDNPGISRTSLSEEFLTAAQMTPGGLSAWHILQIIRNGYQAAFCGQEQRRSHLIEAEKKIIEAVQDGAIE
>NZ_AP017372.2|WP_096410070.1|2282532_2282814_+|CRISPR-associated-endonuclease-Cas2
MARKLFLAAYDVRCPQRLTKSVRVIKGYASGGQKSAYECWLTQAEQEELHLQMANVIDPRVDQFALLPLEPRKPLVTLGAAEEPADPDFFYFG
>NZ_AP017372.2|WP_096410071.1|2282827_2283628_+|hypothetical-protein
MSHAEPRTIYINADRVNVRHEDSALRVNRPGKAATYIPIVRIGRAVIRGCGGEELLGACLALARAGVVIHFQDGNGQQSAWLQPSGEPKNQPAQELAALIGEHTALGPYHWWRDAQRRHCWSMVFRHSPKGDFHSGCKRLEKYLRKLSPLHWIDHEIEALSRDLRSWLQAEIHRRGWNSVCRVLAAQGEDLESELYRCLYIPLLWRFVRWRRQQSLEISEYKRLEFVELQLANPIPRQLYRHLHALTEEYYVSWHKMSKNKVQADE
>NZ_AP017372.2|WP_096410072.1|2283620_2283932_+|CRISPR-associated-endonuclease-Cas2
MSEHPVNHLVCYDIRDPRRLRRVHRKMKEWGTPLQYSVFYCRLVPSARQQLAEVLRHEIDERVDDVRIYALQNRAQGTYQGPAPLPVGLILPGLYLKEQFPGQ
>NZ_AP017372.2|WP_096410073.1|2284042_2285029_+|CRISPR-associated-endonuclease-Cas1
MGTLYIDRRGTKLDYAHKALLIREPDKQPRSVPLNLLERLVVIGNVELTSNVLTNLGASGIGVTFMPARGQNRSSFMRSESHGDSTRRLGQYELATTQPNDPVWAIKLIRLRLASQHRLLHQALIHRPEQRQPIFCALEEIDRMRSHLRHSSQSLTLEQSRGYEGSATAAFFRGYTSLFPESLGFKSRNRRPPRDPVNAILSLGYALAHGDALRATMASGLDPAIGFLHQPAWGRDSLACDLTEIARSRVEQLTWHLFANRSLRAGDFSTDSDGEGVRLRKSARCNFFACWEAHAKLHRRWQKRAANTIASHCLHLGKSLNPGNSEYD
>NZ_AP017372.2|WP_096410074.1|2285021_2285252_+|helix-turn-helix-transcriptional-regulator
MTEFELLVRQQARSKKIPMAEVARRSRLSRQSLYNICNCTSHPKLQTFVDLAHALDISPMVLLEAYLQSADKEEQP
>NZ_AP017372.2|WP_162549511.1|2286555_2286975_-|hypothetical-protein
MSERVSQSTTEANAGQPPNFCKLFVHPKLGQILVLLDEGAEQGPEVRVCCRPSGVSVCTATYRYPDTPEGLLEAQGDFEAFDDEQAFEVARQMFVQMAAKGACDAHQQVADVVIIPDPAAMEVRELDLALANFSQQIIQ

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_AP017372_11

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_AP017372_11

2285423-2285815

TypeIII

Consensus_repeat	Method
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	PILER-CR
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	CRISPRCasFinder
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	CRT

5 spacers

cas1,cas2,csx1,cas6,csm5gr7

The CRISPR arrays of NZ_AP017372_11

>merge|NZ_AP017372|11|2285423-2285815|PILER-CR,CRISPRCasFinder,CRT
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGACCTGTTCTGTTCCCCTTGGTTGAGTATCATTCTGCTGTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGACGTTTCGATCAGCGGGTCATCAAAACCCTTCCGGCGAATGTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGACCGGCTTCCGTCTGAGCGACTTCCCGCTCCATCTCCGTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGACGCCATATCATCGTCAGTATCCTCCCTGAAGCCTAGTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGACTCCAACTCTTTGAGGACCTTGCTTGGGTTGAATTTGTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC

>NZ_AP017372|11|8|2285423-2285815|PILER-CR
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	CTGTTCTGTTCCCCTTGGTTGAGTATCATTCTGCT
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	GTTTCGATCAGCGGGTCATCAAAACCCTTCCGGCGAAT
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	CGGCTTCCGTCTGAGCGACTTCCCGCTCCATCTCC
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	GCCATATCATCGTCAGTATCCTCCCTGAAGCCTA
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	TCCAACTCTTTGAGGACCTTGCTTGGGTTGAATTT
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC

>NZ_AP017372|11|9|2285423-2285815|CRISPRCasFinder
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	CTGTTCTGTTCCCCTTGGTTGAGTATCATTCTGCT
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	GTTTCGATCAGCGGGTCATCAAAACCCTTCCGGCGAAT
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	CGGCTTCCGTCTGAGCGACTTCCCGCTCCATCTCC
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	GCCATATCATCGTCAGTATCCTCCCTGAAGCCTA
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	TCCAACTCTTTGAGGACCTTGCTTGGGTTGAATTT
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC

>NZ_AP017372|11|5|2285423-2285815|CRT
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	CTGTTCTGTTCCCCTTGGTTGAGTATCATTCTGCT
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	GTTTCGATCAGCGGGTCATCAAAACCCTTCCGGCGAAT
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	CGGCTTCCGTCTGAGCGACTTCCCGCTCCATCTCC
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	GCCATATCATCGTCAGTATCCTCCCTGAAGCCTA
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC	TCCAACTCTTTGAGGACCTTGCTTGGGTTGAATTT
GTCTGAATCTGGCCCTGTTTGAGAAGGGATTAAGAC

Protein	Signature genes	Signature genes Name	Protein_function
NZ_AP017372.2\|WP_162549513.1\|2292350_2292617_-\|hypothetical-protein	unknown	unknown	unknown
NZ_AP017372.2\|WP_096410070.1\|2282532_2282814_+\|CRISPR-associated-endonuclease-Cas2	cas2	pfam09827_cas2_CAS-I:CAS-II:CAS-III	gnl\|CDD\|187856
NZ_AP017372.2\|WP_162549512.1\|2291015_2291165_-\|hypothetical-protein	unknown	unknown	unknown
NZ_AP017372.2\|WP_096410079.1\|2289512_2290355_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|197231
NZ_AP017372.2\|WP_096410077.1\|2288135_2289080_+\|LysR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|223656
NZ_AP017372.2\|WP_096410074.1\|2285021_2285252_+\|helix-turn-helix-transcriptional-regulator	unknown	unknown	gnl\|CDD\|197775
NZ_AP017372.2\|WP_096410078.1\|2289160_2289373_-\|hypothetical-protein	unknown	unknown	unknown
NZ_AP017372.2\|WP_096410080.1\|2290580_2290940_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|274164
NZ_AP017372.2\|WP_096410073.1\|2284042_2285029_+\|CRISPR-associated-endonuclease-Cas1	cas1	cd09634_cas1_CAS-I:CAS-II:CAS-III:CAS-V	gnl\|CDD\|376633
NZ_AP017372.2\|WP_162549510.1\|2277575_2278202_+\|CRISPR-system-precrRNA-processing-endoribonuclease-RAMP-protein-Cas6	cas6	mkCas0066_cas6_CAS-I:CAS-III	gnl\|CDD\|337605
NZ_AP017372.2\|WP_096410071.1\|2282827_2283628_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|376633
NZ_AP017372.2\|WP_096410068.1\|2279594_2280182_-\|NUDIX-domain-containing-protein	unknown	unknown	gnl\|CDD\|226597
NZ_AP017372.2\|WP_096410067.1\|2278248_2279460_+\|TIGR02221-family-CRISPR-associated-protein	csx1	cd09732_csx1_CAS-III	gnl\|CDD\|187799
NZ_AP017372.2\|WP_096410083.1\|2293315_2295238_+\|threonine--tRNA-ligase	unknown	unknown	gnl\|CDD\|234752
NZ_AP017372.2\|WP_096410064.1\|2274869_2276369_+\|hypothetical-protein	csm5gr7	cd09662_csm5gr7_CAS-III-A	gnl\|CDD\|187793
NZ_AP017372.2\|WP_162549511.1\|2286555_2286975_-\|hypothetical-protein	unknown	unknown	unknown
NZ_AP017372.2\|WP_096410072.1\|2283620_2283932_+\|CRISPR-associated-endonuclease-Cas2	cas2	pfam09827_cas2_CAS-I:CAS-II:CAS-III	gnl\|CDD\|378256
NZ_AP017372.2\|WP_096410076.1\|2287123_2288041_-\|cation-diffusion-facilitator-family-transporter	unknown	unknown	gnl\|CDD\|226474
NZ_AP017372.2\|WP_096410081.1\|2291382_2292354_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|377859
NZ_AP017372.2\|WP_096410069.1\|2280181_2282353_-\|hypothetical-protein	csx1	cd09741_csx1_CAS-III	gnl\|CDD\|236480

Protein	Function_ID	Function_description	E-value
NZ_AP017372.2\|WP_096410070.1\|2282532_2282814_+\|CRISPR-associated-endonuclease-Cas2	gnl\|CDD\|187856	cd09725, Cas2_I_II_III, CRISPR/Cas system-associated protein Cas2. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas2 is present in majority of CRISPR/Cas systems along with Cas1; RNAse specific to U-rich regions; Possesses an RRM/ferredoxin fold.	3.08801e-07
NZ_AP017372.2\|WP_096410079.1\|2289512_2290355_-\|hypothetical-protein	gnl\|CDD\|197231	cd09133, PLDc_unchar5, Putative catalytic domain of uncharacterized hypothetical proteins with one or two copies of the HKD motif. Putative catalytic domain of uncharacterized hypothetical proteins with similarity to phospholipase D (PLD, EC 3.1.4.4). PLD enzymes hydrolyze phospholipid phosphodiester bonds to yield phosphatidic acid and a free polar head group. They can also catalyze transphosphatidylation of phospholipids to acceptor alcohols. Members of this subfamily contain one or two copies of the HKD motif (H-x-K-x(4)-D, where x represents any amino acid residue) that characterizes the PLD superfamily.	4.48119e-25
NZ_AP017372.2\|WP_096410077.1\|2288135_2289080_+\|LysR-family-transcriptional-regulator	gnl\|CDD\|223656	COG0583, LysR, Transcriptional regulator [Transcription].	6.44928e-33
NZ_AP017372.2\|WP_096410076.1\|2287123_2288041_-\|cation-diffusion-facilitator-family-transporter	gnl\|CDD\|226474	COG3965, COG3965, Predicted Co/Zn/Cd cation transporters [Inorganic ion transport and metabolism].	2.9778e-64
NZ_AP017372.2\|WP_096410080.1\|2290580_2290940_-\|hypothetical-protein	gnl\|CDD\|274164	TIGR02495, RADICAL-ACTIVATING_ENZYME, anaerobic ribonucleoside-triphosphate reductase activating protein. This enzyme is a member of the radical-SAM family (pfam04055). It is often gene clustered with the class III (anaerobic) ribonucleotide triphosphate reductase (NrdD, TIGR02487) and presumably fulfills the identical function as NrdG, which utilizes S-adenosyl methionine, an iron-sulfur cluster and a reductant (dihydroflavodoxin) to produce a glycine-centered radical in NrdD. [Purines, pyrimidines, nucleosides, and nucleotides, 2'-Deoxyribonucleotide metabolism, Protein fate, Protein modification and repair].	4.70964e-36
NZ_AP017372.2\|WP_096410073.1\|2284042_2285029_+\|CRISPR-associated-endonuclease-Cas1	gnl\|CDD\|376633	pfam01867, Cas_Cas1, CRISPR associated protein Cas1. Clustered regularly interspaced short palindromic repeats (CRISPRs) are a family of DNA direct repeats found in many prokaryotic genomes. This family of proteins corresponds to Cas1, a CRISPR-associated protein. Cas1 may be involved in linking DNA segments to CRISPR.	2.49257e-71
NZ_AP017372.2\|WP_162549510.1\|2277575_2278202_+\|CRISPR-system-precrRNA-processing-endoribonuclease-RAMP-protein-Cas6	gnl\|CDD\|337605	pfam10040, CRISPR_Cas6, CRISPR-associated endoribonuclease Cas6. Cas6 is a member of the RAMP (repeat-associated mysterious protein) superfamily. It is among the most widely distributed Cas proteins and is found in both bacteria and archaea. Cas6 functions in the generation of CRISPR-derived guide RNAs for invader defense in prokaryotes.	1.68563e-07
NZ_AP017372.2\|WP_096410071.1\|2282827_2283628_+\|hypothetical-protein	gnl\|CDD\|376633	pfam01867, Cas_Cas1, CRISPR associated protein Cas1. Clustered regularly interspaced short palindromic repeats (CRISPRs) are a family of DNA direct repeats found in many prokaryotic genomes. This family of proteins corresponds to Cas1, a CRISPR-associated protein. Cas1 may be involved in linking DNA segments to CRISPR.	0.00202765
NZ_AP017372.2\|WP_096410068.1\|2279594_2280182_-\|NUDIX-domain-containing-protein	gnl\|CDD\|226597	COG4112, COG4112, Predicted phosphoesterase (MutT family) [General function prediction only].	2.34312e-23
NZ_AP017372.2\|WP_096410067.1\|2278248_2279460_+\|TIGR02221-family-CRISPR-associated-protein	gnl\|CDD\|187799	cd09668, Csx1_III-U, CRISPR/Cas system-associated protein Csx1. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Protein of this family often fused to HTH domain; Some proteins could have an additional fusion with RecB-family nuclease domain; Core domain appears to have a Rossmann-like fold; loosely associated with CRISPR/Cas systems; also known as TM1812 family.	3.09173e-34
NZ_AP017372.2\|WP_096410083.1\|2293315_2295238_+\|threonine--tRNA-ligase	gnl\|CDD\|234752	PRK00413, thrS, threonyl-tRNA synthetase; Reviewed.	0
NZ_AP017372.2\|WP_096410064.1\|2274869_2276369_+\|hypothetical-protein	gnl\|CDD\|187793	cd09662, Csm5_III-A, CRISPR/Cas system-associated RAMP superfamily protein Csm5. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; RAMP superfamily protein.	2.40793e-20
NZ_AP017372.2\|WP_096410072.1\|2283620_2283932_+\|CRISPR-associated-endonuclease-Cas2	gnl\|CDD\|378256	pfam09827, CRISPR_Cas2, CRISPR associated protein Cas2. Members of this family of bacterial proteins comprise various hypothetical proteins, as well as CRISPR (clustered regularly interspaced short palindromic repeats) associated proteins, conferring resistance to infection by certain bacteriophages.	7.26681e-17
NZ_AP017372.2\|WP_096410074.1\|2285021_2285252_+\|helix-turn-helix-transcriptional-regulator	gnl\|CDD\|197775	smart00530, HTH_XRE, Helix-turn-helix XRE-family like proteins.	8.55439e-05
NZ_AP017372.2\|WP_096410081.1\|2291382_2292354_-\|hypothetical-protein	gnl\|CDD\|377859	pfam07514, TraI_2, Putative helicase. Some members of this family have been annotated as helicases.	0.000453982
NZ_AP017372.2\|WP_096410069.1\|2280181_2282353_-\|hypothetical-protein	gnl\|CDD\|236480	PRK09358, PRK09358, adenosine deaminase; Provisional.	1.68612e-58

>NZ_AP017372.2|WP_096410074.1|2285021_2285252_+|helix-turn-helix-transcriptional-regulator
MTEFELLVRQQARSKKIPMAEVARRSRLSRQSLYNICNCTSHPKLQTFVDLAHALDISPMVLLEAYLQSADKEEQP
>NZ_AP017372.2|WP_096410073.1|2284042_2285029_+|CRISPR-associated-endonuclease-Cas1
MGTLYIDRRGTKLDYAHKALLIREPDKQPRSVPLNLLERLVVIGNVELTSNVLTNLGASGIGVTFMPARGQNRSSFMRSESHGDSTRRLGQYELATTQPNDPVWAIKLIRLRLASQHRLLHQALIHRPEQRQPIFCALEEIDRMRSHLRHSSQSLTLEQSRGYEGSATAAFFRGYTSLFPESLGFKSRNRRPPRDPVNAILSLGYALAHGDALRATMASGLDPAIGFLHQPAWGRDSLACDLTEIARSRVEQLTWHLFANRSLRAGDFSTDSDGEGVRLRKSARCNFFACWEAHAKLHRRWQKRAANTIASHCLHLGKSLNPGNSEYD
>NZ_AP017372.2|WP_096410072.1|2283620_2283932_+|CRISPR-associated-endonuclease-Cas2
MSEHPVNHLVCYDIRDPRRLRRVHRKMKEWGTPLQYSVFYCRLVPSARQQLAEVLRHEIDERVDDVRIYALQNRAQGTYQGPAPLPVGLILPGLYLKEQFPGQ
>NZ_AP017372.2|WP_096410071.1|2282827_2283628_+|hypothetical-protein
MSHAEPRTIYINADRVNVRHEDSALRVNRPGKAATYIPIVRIGRAVIRGCGGEELLGACLALARAGVVIHFQDGNGQQSAWLQPSGEPKNQPAQELAALIGEHTALGPYHWWRDAQRRHCWSMVFRHSPKGDFHSGCKRLEKYLRKLSPLHWIDHEIEALSRDLRSWLQAEIHRRGWNSVCRVLAAQGEDLESELYRCLYIPLLWRFVRWRRQQSLEISEYKRLEFVELQLANPIPRQLYRHLHALTEEYYVSWHKMSKNKVQADE
>NZ_AP017372.2|WP_096410070.1|2282532_2282814_+|CRISPR-associated-endonuclease-Cas2
MARKLFLAAYDVRCPQRLTKSVRVIKGYASGGQKSAYECWLTQAEQEELHLQMANVIDPRVDQFALLPLEPRKPLVTLGAAEEPADPDFFYFG
>NZ_AP017372.2|WP_096410069.1|2280181_2282353_-|hypothetical-protein
MNTLVATLGTTWQVLPEIFAYTNPGAAPLYEHSSAAGDIQEERKDYGLRPVQSLWIITTEGGIEEWQNLCQWQQYLPEPIEMRCWYIKGIEELFTPGENRAMADLIYRVALHARLHTRRNNSCLYFALAGGRKTMSAELQQAAHLFGADALLHVVDRFAKQEREQFNSLSFQSLCQPLPKEFADSIRPLVTNGDLPGNEALLNSFQELDCEFEERFPLPGFGDQQRFSIESVPAQDDLHAWVKERQKRAEALLANYRLQVSAHEKLGNFRALYGLSPQTVEKLRQTRLGCDQHKQEQELAWLRRLPKAELHCHLGGILDSAGMIRVAEAMADDLAAEDRRNREFAIWRRDMETAIRSGNIPYLKSLLPGGSLSGKPLRDNFSVTQPLSVAALLYAFRDNPQLLDSLLYGVYQQPSQFTAVGIESYEELGNLQGSGLLQSEKTLRAAMAELGAICRRERIGYLELRCSPLNYVRGDLDKDDVVRILVEEAERIEDCDVRLLFIASRHRDPEQTKEHIELALHWFDNSKSFRERFVGFDLAGAEHAMQPAAMREYFLPLHERVVRMTIHAGEGERAENIWEAVYELSADRIGHGLTLKEYPDLIDRFRDRRIALEMCPSSNRQIRGYYHPHYSPQEERKYPLSSYLEAGLRVSINTDNPGISRTSLSEEFLTAAQMTPGGLSAWHILQIIRNGYQAAFCGQEQRRSHLIEAEKKIIEAVQDGAIE
>NZ_AP017372.2|WP_096410068.1|2279594_2280182_-|NUDIX-domain-containing-protein
MGKGKVLVVPRQDLPDSWLPHEGALRSTWGEVKEVISTAGTLWLERSQAEYDHAYKQLIAYVRLRDSQGSYAVYKRQGSEQRLHGLWSVGLGGHVDEGDCSAADDSDAAKALERAAYRELEEELNGFTPERLEFLGLINEEKTEVGLVHLGMVWEAVAGIDRPKPGAELGEMGWRSPGQLPEDELEYWSRLAMRL
>NZ_AP017372.2|WP_096410067.1|2278248_2279460_+|TIGR02221-family-CRISPR-associated-protein
MHTLVSFIGRTRRPEQGYERIAYNFPDGAVQNGIAFIGNGVAQYTKPDRLVILGTSGSMWDQVIVDYPEVKLGEEKDLALSDSVDNQATTAEQLSEVAAALSETASFTVDLRLIPETPGMEQTWEILHTLVDATSGSDRLTIDITHGFRHLPMVAMMAALYRRTLDDSQSFSVDALWYAQLPPGAKEAEMHNIVGILALADWMEAIQHSRTTGDLSRVAELLREEAPEIAENLAQGSFKETIHQGTQARGPYRKARKTLSETTLPGPAGLFQPILEDQISWVDGQHLHVRQAAHARSALERKDYLRAALYGYEAFVTQLTREHHSIEQLDHHEKRKAASDAFAESCQGRSKEDPKCRAFHQLRQLRNALAHGDQPKHADVQAALHSPQALHKLLSEALDRLLP
>NZ_AP017372.2|WP_162549510.1|2277575_2278202_+|CRISPR-system-precrRNA-processing-endoribonuclease-RAMP-protein-Cas6
MLNPALRWMPTLLPVLHNLQLKRSKLKLQRISLVNTDGLAASGADNKINVTAEELLKINELATPQHPPHPPEFITIRVQQHPLRLRRKNRYVGSEQFDPGVFISALLRRASMLNSITSQATETDFRYLTQLGRSIGLNRSELHWFDWHRHSTPQDRRVPMGGLLGEFQLDSVPEEIWPWVWLGQWLHVGKGAVMGMGRYQLAEYAADN
>NZ_AP017372.2|WP_096410064.1|2274869_2276369_+|hypothetical-protein
MTDIRGARPETENVCIEVVTPLHIGDGESLIKDADFVQERPGHPFRVIDKAGLERRLAEQGGDEVEAYLAHQEMPGLQDLVTLAGGASHAPGYDLPPHEPGHAPASPEIRSTIKDAWLRPLLPGSALKGALRTAWIAQHLRDQVIQPRAQELNKPPRFAAARFLGRLTSAPAHAGSGRPGPNSDAFRVLRPRDAQAPRSALSWVDIRIAKSPRDGKVGWHVTTRSGRRQVDDWSQATALNAEALAPGTVLATQISWDGLLCANESAWRATGNEHIALPRGFCELRDVLIRHARHQIQREKKDLFAWELKAAYRTWQQLEQQLEQAIQQGGAPLRLGFGIGWLGMTGDWLSDETFHTVLAETHWKVKQPHRFPKTRRLVVERGQPQAPLGWVILWPADSGPPPTGQDPEEQKDREDPGDAGHPWVNTKIAELQKAHNSSLEEVLRGKKLAQACQLIDDLETRSEVLADIRRRWQERGWWNDPRGRAMKQARQIYGELTGE
>NZ_AP017372.2|WP_162549511.1|2286555_2286975_-|hypothetical-protein
MSERVSQSTTEANAGQPPNFCKLFVHPKLGQILVLLDEGAEQGPEVRVCCRPSGVSVCTATYRYPDTPEGLLEAQGDFEAFDDEQAFEVARQMFVQMAAKGACDAHQQVADVVIIPDPAAMEVRELDLALANFSQQIIQ
>NZ_AP017372.2|WP_096410076.1|2287123_2288041_-|cation-diffusion-facilitator-family-transporter
MKEFLSRENTSLTVSVIIAALFAAAGIGLGLWMDSLMILFDGAYSLISLVLSMLALYVARLVRQPGNRHFPFGYAALEPLVIAVKGVTITLLCLVSLASALHALLTGGSQIDLDIAIAFTMIGLIACFSCTVYLRWSLARNESGLVAADFEQWRMDTVLSVAILLGFAAAYALERTAWADWAVYADPAMVALVAGYFIWVPLRMTSAAVRELVLAAPPAAMREEVLQATSDLGLPSEAVRMTKVGPYLVLELLVTPSEHTSPEALRFGLYRRLAHIEARPVVLMRASSGADGSWPWLDTPGERPW
>NZ_AP017372.2|WP_096410077.1|2288135_2289080_+|LysR-family-transcriptional-regulator
MRIEQIESVLAVVESGSVAAAARRLGQSRTTVSTAISALEDELGVTLFERSGNRLELSPVGGAILTDCRRLQQVADQIRSRCLHHLSGAESRLCIARDDALPESLWRELLRRLKERYPQTSVSVYVAPPQELPALVERQSVDVAYGLIPPSLSFGYHHLREIADVLMHTVAAAEHPLARMPRVTQDDLVLHTEVTLAYMGTSTLVAESPETANYLAFTQFEIMRDVVMEGSGWADLPLPLIAEPLNRGELRVIRHPEATWWMTLSALETDQAHGRPVVTWMGNALEACFTQWGLAEPAVSTPAVSADLNEQKEP
>NZ_AP017372.2|WP_096410078.1|2289160_2289373_-|hypothetical-protein
MNDRDYFAAHTYVSWQDAENVLRNAGNRKPSVDDVIAARARMRYAEADAMLALRAESSEVEGSLSDNSSG
>NZ_AP017372.2|WP_096410079.1|2289512_2290355_-|hypothetical-protein
MSALNWQAFIALTILAGFLLPLVFISYKKALQVGLGVVLFWLAWTLGLSALFVGYSLSGQLASFQLTLIVLVGLAGVATVYYYNRWKECSARLLEENEALRTSMRDLQDNFSAAAPAKGVRPTRLVRGTKQHRQELLQQVRSAQKRIIILSGWVTRYGFDNTMRRALRNAAKRGVKIYIGWGYKSRQEVAQSSGEATPAEKGLIELARNQKDSMTLAHFKNHSKLLLVDSACTIGSFNWLSNAFSVNDELSVIIEDPGFVEEMWTSVSKDIKRNAISEAL
>NZ_AP017372.2|WP_096410080.1|2290580_2290940_-|hypothetical-protein
MNQLGWADLQELLCRSQGQLDAVVFSGGEPTMQPAIFDAVKAVRDLGFKVVLHTAGSYPQLLQEALPWVDWVAMDIKGEWAHYPEVTGAANSAEKARESVEAVKASGVAYELRVLEGVG
>NZ_AP017372.2|WP_162549512.1|2291015_2291165_-|hypothetical-protein
MIETLHAGGVDNFDVLLRGSAGYPPQLYDAEHPLALLYCGGRKDLLASP
>NZ_AP017372.2|WP_096410081.1|2291382_2292354_-|hypothetical-protein
MKLIKFTPEKADVPWSGEYRVAQVNPRIRMVNLHELELEDCSGSLKVLYLAPMDEFGQPCPPWEGSVVRVTVTLTQALHGGWYNRVDKLEQIDEYSTLQLLPHRLCPVPGLLYRLYEVVNREITNPALRRFLERVFADQKRTRAFVSKPASVDCHHVEPGGLLKHSLQIVHGLDMLTWGHQNGVSRQCLLVSALLHDLGKVARDVLGMLPFQAREHASLNKLLLEKELSLLKEEDLEAWLLLHYMFSAIEGITDGNRVPGVGLLLALDRFSAAEDASRRAFESLPRYRQIASLKPSNGGPSRSFYRPRSEALQLGERCAGAVM
>NZ_AP017372.2|WP_162549513.1|2292350_2292617_-|hypothetical-protein
MTQIKGPGFSAYIVPAAVEEMAQVLLSAFASEDSDVLRAAVGAREGQPLQEALEDWLLLQLDLEDQAVAQILFRLFVDRLQRRVEVLT
>NZ_AP017372.2|WP_096410083.1|2293315_2295238_+|threonine--tRNA-ligase
MPNITLPDGSVKSFDNPPTIHEIATSIGSKLAKDAVAGRIDGELVDLTCTVDRDAQVEIVTAKDDDGLEIIRHSTAHLMAQAVKQLHPEMQVTIGPTVENGFYYDFAGEHSISEDQLEAIEQRMSELAEADQPVEREVWDRQAAKEFFLEQGETYKAQIIDELPEGEAVSVYRQGDFVDLCRGPHVPSTGKLKAFKLTKVAGAYWRGDQNNEMLQRLYGTAWGDRKQLKAYLQRLEEAEKRDHRRLARSLDLFHVQEESPGMVFWHPRGWQLYLTVESYIRDLMRNNGYHEVRTPMLVDRSLWERSGHWEMFASNMFVTESESRDYAVKPMNCPCHVEIYKQGLKSYRELPLRLAEFGSCHRNEPSGTLHGLMRVRGFVQDDAHIFCTEEQIQSEVRAFIDLVHTAYRHFGFNEVIIALSTRPDERVGDDAVWDKAEQALAQALEDHGLNYTVQPGEGAFYGPKIEFSLRDCLERVWQLGTIQVDFSMPGRLGAQYVDEDGERRTPVMLHRAILGSLERFIGILIEHYGGALPTWLAPVQVAVLNITDRQADYAQQIAASLREYGFRADVDLRNEKIGYKIREHTLQKVPYMLVLGDREMDTQTVAVRMRDGTDLGSMGYEELVARLQQDISHPGCNTED

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Mismatch	Identity
NZ_AP017372_6	6.1\|2199827\|37\|NZ_AP017372\|CRISPRCasFinder	2199827-2199863	37	NZ_AP017372.2	478561-478597	0	1.0
NZ_AP017372_6	6.1\|2199827\|37\|NZ_AP017372\|CRISPRCasFinder	2199827-2199863	37	NZ_AP017372.2	871648-871684	2	0.946

1. spacer 6.1|2199827|37|NZ_AP017372|CRISPRCasFinder matches to position: 478561-478597, mismatch: 0, identity: 1.0

ggggcgggtggtggcgccggcgaagttttagaggtgc	CRISPR spacer
ggggcgggtggtggcgccggcgaagttttagaggtgc	Protospacer
*************************************

2. spacer 6.1|2199827|37|NZ_AP017372|CRISPRCasFinder matches to position: 871648-871684, mismatch: 2, identity: 0.946

ggggcgggtggtggcgccggcgaagttttagaggtgc	CRISPR spacer
ggggcagatggtggcgccggcgaagttttagaggtgc	Protospacer
*****.*.*****************************

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity
NZ_AP017372_4	4.9\|760599\|32\|NZ_AP017372\|CRISPRCasFinder,CRT,PILER-CR	760599-760630	32	NZ_CP032687	Rhizobium sp. CCGE531 plasmid pRCCGE531b, complete sequence	159105-159136	7	0.781
NZ_AP017372_4	4.9\|760599\|32\|NZ_AP017372\|CRISPRCasFinder,CRT,PILER-CR	760599-760630	32	NZ_CP032692	Rhizobium sp. CCGE532 plasmid pRCCGE532b, complete sequence	425982-426013	7	0.781
NZ_AP017372_4	4.9\|760599\|32\|NZ_AP017372\|CRISPRCasFinder,CRT,PILER-CR	760599-760630	32	NC_020061	Rhizobium tropici CIAT 899 plasmid pRtrCIAT899b, complete sequence	159137-159168	7	0.781
NZ_AP017372_5	5.1\|761987\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	761987-762018	32	CP000662	Rhodobacter sphaeroides ATCC 17025 plasmid pRSPA01, complete sequence	247056-247087	7	0.781
NZ_AP017372_5	5.1\|761987\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	761987-762018	32	NZ_CP009112	Rhodococcus opacus strain 1CP plasmid pR1CP1, complete sequence	402167-402198	7	0.781
NZ_AP017372_5	5.9\|762475\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762475-762506	32	NZ_CP045721	Pantoea eucalypti strain LMG 24197 plasmid unnamed1, complete sequence	180184-180215	7	0.781
NZ_AP017372_5	5.9\|762475\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762475-762506	32	NZ_CP022517	Pantoea vagans strain FBS135 plasmid pPant1, complete sequence	206637-206668	7	0.781
NZ_AP017372_5	5.14\|762780\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762780-762811	32	NZ_KY349138	Mycolicibacterium sp. CBMA 213 plasmid pCBMA213_2, complete sequence	49120-49151	7	0.781
NZ_AP017372_5	5.29\|763696\|32\|NZ_AP017372\|CRISPRCasFinder,CRT,PILER-CR	763696-763727	32	MK504443	Lactobacillus phage 521B, complete genome	31167-31198	7	0.781
NZ_AP017372_5	5.35\|762474\|33\|NZ_AP017372\|PILER-CR	762474-762506	33	NZ_CP045721	Pantoea eucalypti strain LMG 24197 plasmid unnamed1, complete sequence	180183-180215	7	0.788
NZ_AP017372_5	5.35\|762474\|33\|NZ_AP017372\|PILER-CR	762474-762506	33	NZ_CP022517	Pantoea vagans strain FBS135 plasmid pPant1, complete sequence	206637-206669	7	0.788
NZ_AP017372_4	4.3\|760233\|32\|NZ_AP017372\|CRISPRCasFinder,CRT,PILER-CR	760233-760264	32	NZ_CP041653	Streptomyces sp. RLB1-9 plasmid pRLB1-9.1, complete sequence	122375-122406	8	0.75
NZ_AP017372_4	4.9\|760599\|32\|NZ_AP017372\|CRISPRCasFinder,CRT,PILER-CR	760599-760630	32	NZ_CP054028	Rhizobium sp. JKLM19E plasmid pPR19E01, complete sequence	1308792-1308823	8	0.75
NZ_AP017372_5	5.10\|762536\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762536-762567	32	MN586006	Mycobacterium phage Bachome, complete genome	46095-46126	8	0.75
NZ_AP017372_5	5.10\|762536\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762536-762567	32	NZ_CP021777	UNVERIFIED_ORG: Enterobacter cloacae strain AR_0053 plasmid unitig_2, complete sequence	15741-15772	8	0.75
NZ_AP017372_5	5.11\|762597\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762597-762628	32	NZ_CP054609	Paenibacillus cellulosilyticus strain KACC 14175 plasmid unnamed1, complete sequence	467359-467390	8	0.75
NZ_AP017372_5	5.11\|762597\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762597-762628	32	MK675901	Shewanella phage S0112, complete genome	29865-29896	8	0.75
NZ_AP017372_5	5.21\|763208\|32\|NZ_AP017372\|CRISPRCasFinder,CRT,PILER-CR	763208-763239	32	KX961385	Bordetella virus LK3, complete genome	10463-10494	8	0.75
NZ_AP017372_5	5.21\|763208\|32\|NZ_AP017372\|CRISPRCasFinder,CRT,PILER-CR	763208-763239	32	KY000220	Bordetella phage FP1, complete genome	46123-46154	8	0.75
NZ_AP017372_5	5.21\|763208\|32\|NZ_AP017372\|CRISPRCasFinder,CRT,PILER-CR	763208-763239	32	KY000221	Bordetella phage CN1, complete genome	45629-45660	8	0.75
NZ_AP017372_5	5.21\|763208\|32\|NZ_AP017372\|CRISPRCasFinder,CRT,PILER-CR	763208-763239	32	NC_047877	Bordetella phage CN2, complete genome	47895-47926	8	0.75
NZ_AP017372_5	5.22\|763269\|32\|NZ_AP017372\|CRISPRCasFinder,CRT,PILER-CR	763269-763300	32	MG757154	Streptomyces phage Bing, complete genome	10964-10995	8	0.75
NZ_AP017372_5	5.24\|763391\|32\|NZ_AP017372\|CRISPRCasFinder,CRT,PILER-CR	763391-763422	32	NZ_CP015043	Rhodovulum sp. P5 plasmid pRGUI04, complete sequence	45717-45748	8	0.75
NZ_AP017372_5	5.26\|763513\|32\|NZ_AP017372\|CRISPRCasFinder,CRT,PILER-CR	763513-763544	32	NC_028795	Enterobacter phage E-3, complete genome	2696-2727	8	0.75
NZ_AP017372_5	5.26\|763513\|32\|NZ_AP017372\|CRISPRCasFinder,CRT,PILER-CR	763513-763544	32	NC_016974	Providencia stuartii plasmid pMR0211, complete sequence	149759-149790	8	0.75
NZ_AP017372_5	5.37\|762596\|33\|NZ_AP017372\|PILER-CR	762596-762628	33	MK675901	Shewanella phage S0112, complete genome	29864-29896	8	0.758
NZ_AP017372_4	4.1\|760111\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	760111-760142	32	NZ_CP016453	Sphingobium sp. RAC03 plasmid pBSY17_1, complete sequence	303921-303952	9	0.719
NZ_AP017372_4	4.2\|760172\|32\|NZ_AP017372\|CRISPRCasFinder,CRT,PILER-CR	760172-760203	32	NZ_CP017076	Novosphingobium resinovorum strain SA1 plasmid pSA1, complete sequence	51753-51784	9	0.719
NZ_AP017372_4	4.8\|760538\|32\|NZ_AP017372\|CRISPRCasFinder,CRT,PILER-CR	760538-760569	32	NZ_CP015203	Rhodococcus sp. 008 plasmid pR8L1, complete sequence	672277-672308	9	0.719
NZ_AP017372_5	5.1\|761987\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	761987-762018	32	NC_013858	Azospirillum sp. B510 plasmid pAB510d, complete sequence	272189-272220	9	0.719
NZ_AP017372_5	5.12\|762658\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762658-762689	32	MN032972	Leviviridae sp. isolate H2_Rhizo_Litter_7_scaffold_10692 sequence	627-658	9	0.719
NZ_AP017372_5	5.12\|762658\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762658-762689	32	MN033187	Leviviridae sp. isolate H2_Rhizo_Litter_49_scaffold_9067 RNA-dependent RNA polymerase (H2RhizoLitter499067_000001) gene, complete cds; and hypothetical protein (H2RhizoLitter499067_000002) gene, partial cds	578-609	9	0.719
NZ_AP017372_5	5.14\|762780\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762780-762811	32	NZ_AP022319	Burkholderia sp. THE68 plasmid BTHE68_p1, complete sequence	1456123-1456154	9	0.719
NZ_AP017372_5	5.14\|762780\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762780-762811	32	NZ_CP026091	Ralstonia solanacearum strain IBSBF 2570 plasmid unnamed, complete sequence	1643147-1643178	9	0.719
NZ_AP017372_5	5.14\|762780\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762780-762811	32	NC_014309	Ralstonia solanacearum CFBP2957 plasmid RCFBPv3_mp, complete genome	498224-498255	9	0.719
NZ_AP017372_5	5.14\|762780\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762780-762811	32	NZ_CP026093	Ralstonia solanacearum strain SFC plasmid unnamed, complete sequence	1643282-1643313	9	0.719
NZ_AP017372_5	5.14\|762780\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762780-762811	32	NZ_CP012940	Ralstonia solanacearum strain UW163 plasmid unnamed, complete sequence	377406-377437	9	0.719
NZ_AP017372_5	5.14\|762780\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762780-762811	32	NZ_CP012944	Ralstonia solanacearum strain IBSBF1503 plasmid unnamed, complete sequence	1523646-1523677	9	0.719
NZ_AP017372_5	5.14\|762780\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762780-762811	32	NC_017575	Ralstonia solanacearum Po82 megaplasmid, complete sequence	1642871-1642902	9	0.719
NZ_AP017372_5	5.14\|762780\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762780-762811	32	NZ_CP026308	Ralstonia solanacearum strain IBSBF 2571 plasmid unnamed, complete sequence	1642817-1642848	9	0.719
NZ_AP017372_5	5.14\|762780\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762780-762811	32	NZ_CP051295	Ralstonia solanacearum strain CIAT_078 plasmid megaplasmid, complete sequence	375047-375078	9	0.719
NZ_AP017372_5	5.17\|762963\|33\|NZ_AP017372\|CRISPRCasFinder,CRT	762963-762995	33	JQ067087	Pseudomonas phage PaMx11, complete genome	14969-15001	9	0.727
NZ_AP017372_5	5.21\|763208\|32\|NZ_AP017372\|CRISPRCasFinder,CRT,PILER-CR	763208-763239	32	MN694560	Marine virus AFVG_250M172, complete genome	44240-44271	9	0.719
NZ_AP017372_5	5.27\|763574\|32\|NZ_AP017372\|CRISPRCasFinder,CRT,PILER-CR	763574-763605	32	NC_009620	Sinorhizobium medicae WSM419 plasmid pSMED01, complete sequence	296578-296609	9	0.719
NZ_AP017372_5	5.36\|762535\|33\|NZ_AP017372\|PILER-CR	762535-762567	33	MN586006	Mycobacterium phage Bachome, complete genome	46094-46126	9	0.727
NZ_AP017372_5	5.1\|761987\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	761987-762018	32	NZ_CP007130	Gemmatirosa kalamazoonesis strain KBS708 plasmid 2, complete sequence	805892-805923	10	0.688
NZ_AP017372_5	5.8\|762414\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762414-762445	32	NC_019849	Sinorhizobium meliloti GR4 plasmid pRmeGR4d, complete sequence	123441-123472	10	0.688
NZ_AP017372_5	5.8\|762414\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762414-762445	32	NZ_CP019586	Sinorhizobium meliloti strain CCMM B554 (FSM-MA) plasmid pSymB, complete sequence	1582839-1582870	10	0.688
NZ_AP017372_5	5.8\|762414\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762414-762445	32	NC_017326	Sinorhizobium meliloti SM11 plasmid pSmeSM11d, complete sequence	123245-123276	10	0.688
NZ_AP017372_5	5.8\|762414\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762414-762445	32	NC_017323	Sinorhizobium meliloti BL225C plasmid pSINMEB02, complete sequence	1358525-1358556	10	0.688
NZ_AP017372_5	5.8\|762414\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762414-762445	32	NZ_CP021828	Sinorhizobium meliloti strain KH35c plasmid psymB, complete sequence	1188349-1188380	10	0.688
NZ_AP017372_5	5.8\|762414\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762414-762445	32	NZ_CP021820	Sinorhizobium meliloti strain M162 plasmid psymB, complete sequence	461741-461772	10	0.688
NZ_AP017372_5	5.8\|762414\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762414-762445	32	NZ_CP021831	Sinorhizobium meliloti strain HM006 plasmid psymB, complete sequence	368399-368430	10	0.688
NZ_AP017372_5	5.8\|762414\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762414-762445	32	NZ_CP021814	Sinorhizobium meliloti strain M270 plasmid psymB, complete sequence	1689565-1689596	10	0.688
NZ_AP017372_5	5.8\|762414\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762414-762445	32	NZ_CP021795	Sinorhizobium meliloti strain USDA1157 plasmid psymB, complete sequence	846546-846577	10	0.688
NZ_AP017372_5	5.8\|762414\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762414-762445	32	NZ_CP021806	Sinorhizobium meliloti strain T073 plasmid psymB, complete sequence	898532-898563	10	0.688
NZ_AP017372_5	5.14\|762780\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762780-762811	32	NZ_AP022319	Burkholderia sp. THE68 plasmid BTHE68_p1, complete sequence	790797-790828	10	0.688
NZ_AP017372_5	5.14\|762780\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762780-762811	32	NZ_CP050100	Rhizobium leguminosarum bv. trifolii strain 9B plasmid pRL9b3, complete sequence	164525-164556	10	0.688
NZ_AP017372_5	5.14\|762780\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762780-762811	32	NZ_CP025017	Rhizobium leguminosarum strain Norway plasmid pRLN5, complete sequence	145251-145282	10	0.688
NZ_AP017372_5	5.14\|762780\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762780-762811	32	NZ_CP053443	Rhizobium leguminosarum bv. trifolii strain CC275e plasmid pRltCC275eC, complete sequence	127274-127305	10	0.688
NZ_AP017372_5	5.14\|762780\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762780-762811	32	NZ_CP044308	Escherichia coli strain C27A plasmid pC27A-3, complete sequence	91247-91278	10	0.688
NZ_AP017372_5	5.14\|762780\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762780-762811	32	NZ_CP018232	Rhizobium leguminosarum strain Vaf-108 plasmid unnamed4, complete sequence	146709-146740	10	0.688
NZ_AP017372_5	5.16\|762902\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762902-762933	32	MF399199	Acinetobacter baumannii strain D46 plasmid pD46-4, complete sequence	109511-109542	10	0.688
NZ_AP017372_5	5.16\|762902\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762902-762933	32	MF399199	Acinetobacter baumannii strain D46 plasmid pD46-4, complete sequence	176712-176743	10	0.688
NZ_AP017372_5	5.16\|762902\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762902-762933	32	NZ_KT601170	Staphylococcus sciuri strain wo28-3 plasmid pwo28-3, complete sequence	7774-7805	10	0.688
NZ_AP017372_5	5.16\|762902\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762902-762933	32	NZ_KX982169	Staphylococcus sciuri strain wo27-9 plasmid pWo27-9, complete sequence	51627-51658	10	0.688
NZ_AP017372_5	5.16\|762902\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762902-762933	32	NZ_KX982171	Staphylococcus sciuri strain wo28-1 plasmid pWo28-1, complete sequence	55935-55966	10	0.688
NZ_AP017372_5	5.16\|762902\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762902-762933	32	NZ_CP040051	Acinetobacter baumannii strain VB16141 plasmid unnamed1, complete sequence	65937-65968	10	0.688
NZ_AP017372_5	5.16\|762902\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762902-762933	32	NZ_CP040051	Acinetobacter baumannii strain VB16141 plasmid unnamed1, complete sequence	104115-104146	10	0.688
NZ_AP017372_5	5.16\|762902\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762902-762933	32	NZ_KX426227	Acinetobacter lwoffii strain ED23-35 plasmid pALWED1.1, complete sequence	135629-135660	10	0.688
NZ_AP017372_5	5.16\|762902\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762902-762933	32	NZ_AP014650	Acinetobacter baumannii strain IOMTU433 plasmid pIOMTU433, complete sequence	54973-55004	10	0.688
NZ_AP017372_5	5.16\|762902\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762902-762933	32	NZ_AP014650	Acinetobacter baumannii strain IOMTU433 plasmid pIOMTU433, complete sequence	93153-93184	10	0.688
NZ_AP017372_5	5.16\|762902\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762902-762933	32	CP033569	Acinetobacter pittii strain 2014N21-145 plasmid p2014N21-145-1, complete sequence	191947-191978	10	0.688
NZ_AP017372_5	5.16\|762902\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762902-762933	32	NZ_CP012007	Acinetobacter baumannii strain Ab04-mff plasmid pAB04-1, complete sequence	56063-56094	10	0.688
NZ_AP017372_5	5.16\|762902\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762902-762933	32	CP040054	Acinetobacter baumannii strain VB35179 plasmid unnamed1, complete sequence	52236-52267	10	0.688
NZ_AP017372_5	5.16\|762902\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762902-762933	32	CP040054	Acinetobacter baumannii strain VB35179 plasmid unnamed1, complete sequence	126675-126706	10	0.688
NZ_AP017372_5	5.16\|762902\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762902-762933	32	NZ_CP050433	Acinetobacter baumannii strain PM194229 plasmid pPM194229_1, complete sequence	118555-118586	10	0.688
NZ_AP017372_5	5.16\|762902\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762902-762933	32	NZ_CP050386	Acinetobacter baumannii strain VB82 plasmid pVB82_1, complete sequence	129578-129609	10	0.688
NZ_AP017372_5	5.16\|762902\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762902-762933	32	NZ_KU744946	Acinetobacter baumannii strain A297 (RUH875) plasmid pA297-3 clone Global clone 1 (GC1), complete sequence	92231-92262	10	0.688
NZ_AP017372_5	5.16\|762902\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762902-762933	32	NZ_KU744946	Acinetobacter baumannii strain A297 (RUH875) plasmid pA297-3 clone Global clone 1 (GC1), complete sequence	170225-170256	10	0.688
NZ_AP017372_5	5.16\|762902\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762902-762933	32	NZ_CP020596	Acinetobacter baumannii strain HWBA8 plasmid pHWBA8_1, complete sequence	154076-154107	10	0.688
NZ_AP017372_5	5.16\|762902\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762902-762933	32	NZ_CP040260	Acinetobacter baumannii strain P7774 plasmid unnamed1, complete sequence	135714-135745	10	0.688
NZ_AP017372_5	5.16\|762902\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762902-762933	32	NZ_KT779035	Acinetobacter baumannii strain D4 plasmid pD4, complete sequence	102224-102255	10	0.688
NZ_AP017372_5	5.16\|762902\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	762902-762933	32	NZ_MK323043	Acinetobacter baumannii strain Acb-45063 plasmid pAb45063_b, complete sequence	3661-3692	10	0.688
NZ_AP017372_5	5.19\|763086\|32\|NZ_AP017372\|CRISPRCasFinder,CRT,PILER-CR	763086-763117	32	NC_016626	Burkholderia sp. YI23 plasmid byi_1p, complete sequence	704027-704058	10	0.688
NZ_AP017372_5	5.24\|763391\|32\|NZ_AP017372\|CRISPRCasFinder,CRT,PILER-CR	763391-763422	32	NZ_CP044079	Paracoccus yeei strain FDAARGOS_643 plasmid unnamed2, complete sequence	64512-64543	10	0.688
NZ_AP017372_5	5.40\|762779\|33\|NZ_AP017372\|PILER-CR	762779-762811	33	NZ_AP022319	Burkholderia sp. THE68 plasmid BTHE68_p1, complete sequence	1456122-1456154	10	0.697
NZ_AP017372_4	4.6\|760416\|32\|NZ_AP017372\|CRISPRCasFinder,CRT,PILER-CR	760416-760447	32	MG065659	UNVERIFIED: Campylobacter phage C5, complete genome	37923-37954	11	0.656
NZ_AP017372_4	4.6\|760416\|32\|NZ_AP017372\|CRISPRCasFinder,CRT,PILER-CR	760416-760447	32	MG065655	UNVERIFIED: Campylobacter phage C2, complete genome	5920-5951	11	0.656
NZ_AP017372_4	4.6\|760416\|32\|NZ_AP017372\|CRISPRCasFinder,CRT,PILER-CR	760416-760447	32	MG065666	UNVERIFIED: Campylobacter phage A12a, complete genome	4290-4321	11	0.656
NZ_AP017372_4	4.6\|760416\|32\|NZ_AP017372\|CRISPRCasFinder,CRT,PILER-CR	760416-760447	32	KJ190158	Escherichia phage vB_EcoM_FFH2, complete genome	111492-111523	11	0.656
NZ_AP017372_4	4.6\|760416\|32\|NZ_AP017372\|CRISPRCasFinder,CRT,PILER-CR	760416-760447	32	MG065654	UNVERIFIED: Campylobacter phage C15, complete genome	4317-4348	11	0.656
NZ_AP017372_4	4.9\|760599\|32\|NZ_AP017372\|CRISPRCasFinder,CRT,PILER-CR	760599-760630	32	NZ_CP022605	Ochrobactrum quorumnocens strain A44 plasmid unnamed1, complete sequence	589538-589569	11	0.656
NZ_AP017372_5	5.1\|761987\|32\|NZ_AP017372\|CRISPRCasFinder,CRT	761987-762018	32	NC_020062	Rhizobium tropici CIAT 899 plasmid pRtrCIAT899c, complete sequence	1330843-1330874	11	0.656

1. spacer 4.9|760599|32|NZ_AP017372|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP032687 (Rhizobium sp. CCGE531 plasmid pRCCGE531b, complete sequence) position: , mismatch: 7, identity: 0.781

caatcttagcactgtcaagatcgacggactgg	CRISPR spacer
cacgctcggcactatcaagatcgacggattgc	Protospacer
**  **..*****.**************.**

2. spacer 4.9|760599|32|NZ_AP017372|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP032692 (Rhizobium sp. CCGE532 plasmid pRCCGE532b, complete sequence) position: , mismatch: 7, identity: 0.781

caatcttagcactgtcaagatcgacggactgg	CRISPR spacer
cacgctcggcactatcaagatcgacggattgc	Protospacer
**  **..*****.**************.**

3. spacer 4.9|760599|32|NZ_AP017372|CRISPRCasFinder,CRT,PILER-CR matches to NC_020061 (Rhizobium tropici CIAT 899 plasmid pRtrCIAT899b, complete sequence) position: , mismatch: 7, identity: 0.781

caatcttagcactgtcaagatcgacggactgg	CRISPR spacer
cacgctcggcactatcaagatcgacggattgc	Protospacer
**  **..*****.**************.**

4. spacer 5.1|761987|32|NZ_AP017372|CRISPRCasFinder,CRT matches to CP000662 (Rhodobacter sphaeroides ATCC 17025 plasmid pRSPA01, complete sequence) position: , mismatch: 7, identity: 0.781

cggactcgacctcctccatcgagccgtaactc	CRISPR spacer
aggcctcgacctcctccatcgagcggaggcgc	Protospacer
 ** ******************** * ..* *

5. spacer 5.1|761987|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_CP009112 (Rhodococcus opacus strain 1CP plasmid pR1CP1, complete sequence) position: , mismatch: 7, identity: 0.781

cggactcgacctcctccatcgagccgtaactc	CRISPR spacer
ccggctcgacgtcctccatcgagacgtgaagc	Protospacer
* *.****** ************ ***.*  *

6. spacer 5.9|762475|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_CP045721 (Pantoea eucalypti strain LMG 24197 plasmid unnamed1, complete sequence) position: , mismatch: 7, identity: 0.781

agttgggtgctgagcttgtccctgcaatgctt	CRISPR spacer
actggtatgctgagcatggccctgcaatgctg	Protospacer
* * * .******** ** ************

7. spacer 5.9|762475|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_CP022517 (Pantoea vagans strain FBS135 plasmid pPant1, complete sequence) position: , mismatch: 7, identity: 0.781

agttgggtgctgagcttgtccctgcaatgctt	CRISPR spacer
actggtatgctgagcatggccctgcaatgctg	Protospacer
* * * .******** ** ************

8. spacer 5.14|762780|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_KY349138 (Mycolicibacterium sp. CBMA 213 plasmid pCBMA213_2, complete sequence) position: , mismatch: 7, identity: 0.781

ataaccggcggcggtgagccgtcagatgagtg-	CRISPR spacer
ctcggcggcggcgttgggccgtcagatg-gtgt	Protospacer
 * . ******** **.*********** ***

9. spacer 5.29|763696|32|NZ_AP017372|CRISPRCasFinder,CRT,PILER-CR matches to MK504443 (Lactobacillus phage 521B, complete genome) position: , mismatch: 7, identity: 0.781

tcatcggtagtcattaaatctgctactcgtat	CRISPR spacer
tcgctggtaatcattaagtctgctactcccat	Protospacer
**...****.*******.********** .**

10. spacer 5.35|762474|33|NZ_AP017372|PILER-CR matches to NZ_CP045721 (Pantoea eucalypti strain LMG 24197 plasmid unnamed1, complete sequence) position: , mismatch: 7, identity: 0.788

gagttgggtgctgagcttgtccctgcaatgctt	CRISPR spacer
gactggtatgctgagcatggccctgcaatgctg	Protospacer
** * * .******** ** ************

11. spacer 5.35|762474|33|NZ_AP017372|PILER-CR matches to NZ_CP022517 (Pantoea vagans strain FBS135 plasmid pPant1, complete sequence) position: , mismatch: 7, identity: 0.788

gagttgggtgctgagcttgtccctgcaatgctt	CRISPR spacer
gactggtatgctgagcatggccctgcaatgctg	Protospacer
** * * .******** ** ************

12. spacer 4.3|760233|32|NZ_AP017372|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP041653 (Streptomyces sp. RLB1-9 plasmid pRLB1-9.1, complete sequence) position: , mismatch: 8, identity: 0.75

gtaagtaccccgacgcggagccgtcgcactac	CRISPR spacer
ccaagaaccccgacgcgaagccgtcgttcggc	Protospacer
 .*** ***********.********. * .*

13. spacer 4.9|760599|32|NZ_AP017372|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP054028 (Rhizobium sp. JKLM19E plasmid pPR19E01, complete sequence) position: , mismatch: 8, identity: 0.75

caatcttagcactgtcaagatcgacggactgg	CRISPR spacer
cgcggttagcactgtgaagatggacggatcgg	Protospacer
*.   ********** ***** ******..**

14. spacer 5.10|762536|32|NZ_AP017372|CRISPRCasFinder,CRT matches to MN586006 (Mycobacterium phage Bachome, complete genome) position: , mismatch: 8, identity: 0.75

cgttcagctgctcgcggacacgctcttcgtca	CRISPR spacer
tgttctcctgctcgcggacacgctcagcgatg	Protospacer
.****  ******************  ** ..

15. spacer 5.10|762536|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_CP021777 (UNVERIFIED_ORG: Enterobacter cloacae strain AR_0053 plasmid unitig_2, complete sequence) position: , mismatch: 8, identity: 0.75

cgttcagctgctcgcggacacgctcttcgtca	CRISPR spacer
cgttcagctgctcgctgatacgcccgtgcaaa	Protospacer
*************** **.****.* *    *

16. spacer 5.11|762597|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_CP054609 (Paenibacillus cellulosilyticus strain KACC 14175 plasmid unnamed1, complete sequence) position: , mismatch: 8, identity: 0.75

ctgcccatggaatatgagccggatc--gccattg	CRISPR spacer
ggacccattgaatatgagacggatcgggcgat--	Protospacer
  .***** ********* ******  ** **

17. spacer 5.11|762597|32|NZ_AP017372|CRISPRCasFinder,CRT matches to MK675901 (Shewanella phage S0112, complete genome) position: , mismatch: 8, identity: 0.75

ctgcccatggaatatgagccggatcgccattg	CRISPR spacer
cttccgatggaatatgagccggagagatgctg	Protospacer
** ** *****************  * ...**

18. spacer 5.21|763208|32|NZ_AP017372|CRISPRCasFinder,CRT,PILER-CR matches to KX961385 (Bordetella virus LK3, complete genome) position: , mismatch: 8, identity: 0.75

ccctggcgcccggacgatgcccgtgtctatca	CRISPR spacer
gtcggtggcccggacgatgcccgtttcaatct	Protospacer
 .* *  ***************** ** ***

19. spacer 5.21|763208|32|NZ_AP017372|CRISPRCasFinder,CRT,PILER-CR matches to KY000220 (Bordetella phage FP1, complete genome) position: , mismatch: 8, identity: 0.75

ccctggcgcccggacgatgcccgtgtctatca	CRISPR spacer
gtcggtggcccggacgatgcccgtttcaatct	Protospacer
 .* *  ***************** ** ***

20. spacer 5.21|763208|32|NZ_AP017372|CRISPRCasFinder,CRT,PILER-CR matches to KY000221 (Bordetella phage CN1, complete genome) position: , mismatch: 8, identity: 0.75

ccctggcgcccggacgatgcccgtgtctatca	CRISPR spacer
gtcggtggcccggacgatgcccgtttcaatct	Protospacer
 .* *  ***************** ** ***

21. spacer 5.21|763208|32|NZ_AP017372|CRISPRCasFinder,CRT,PILER-CR matches to NC_047877 (Bordetella phage CN2, complete genome) position: , mismatch: 8, identity: 0.75

ccctggcgcccggacgatgcccgtgtctatca	CRISPR spacer
gtcggtggcccggacgatgcccgtttcaatct	Protospacer
 .* *  ***************** ** ***

22. spacer 5.22|763269|32|NZ_AP017372|CRISPRCasFinder,CRT,PILER-CR matches to MG757154 (Streptomyces phage Bing, complete genome) position: , mismatch: 8, identity: 0.75

atgaaccgatcaccagccttgtcccacggcaa	CRISPR spacer
tagtaccgctcgccagccttgtcccacgtaag	Protospacer
  * **** **.****************  *.

23. spacer 5.24|763391|32|NZ_AP017372|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP015043 (Rhodovulum sp. P5 plasmid pRGUI04, complete sequence) position: , mismatch: 8, identity: 0.75

gcgatggagctgtttggcgcgcgctactttag	CRISPR spacer
tgcatggggctgcttggcgcgcgctacatgaa	Protospacer
   ****.****.************** * *.

24. spacer 5.26|763513|32|NZ_AP017372|CRISPRCasFinder,CRT,PILER-CR matches to NC_028795 (Enterobacter phage E-3, complete genome) position: , mismatch: 8, identity: 0.75

aaaggctggttaggtggcatcagagccattaa	CRISPR spacer
gtcagtcggataggtggcatcagagccatcaa	Protospacer
.  .*..** *******************.**

25. spacer 5.26|763513|32|NZ_AP017372|CRISPRCasFinder,CRT,PILER-CR matches to NC_016974 (Providencia stuartii plasmid pMR0211, complete sequence) position: , mismatch: 8, identity: 0.75

aaaggctggttaggtggcatcagagccattaa	CRISPR spacer
tgaggctggttcggtggcatgagagctgatta	Protospacer
 .********* ******** *****.. * *

26. spacer 5.37|762596|33|NZ_AP017372|PILER-CR matches to MK675901 (Shewanella phage S0112, complete genome) position: , mismatch: 8, identity: 0.758

gctgcccatggaatatgagccggatcgccattg	CRISPR spacer
gcttccgatggaatatgagccggagagatgctg	Protospacer
*** ** *****************  * ...**

27. spacer 4.1|760111|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_CP016453 (Sphingobium sp. RAC03 plasmid pBSY17_1, complete sequence) position: , mismatch: 9, identity: 0.719

cagcgacaattaaccggcattcctggcaaaat	CRISPR spacer
gtggtataattaaccggcattcatggccaagc	Protospacer
  *  *.*************** **** **..

28. spacer 4.2|760172|32|NZ_AP017372|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP017076 (Novosphingobium resinovorum strain SA1 plasmid pSA1, complete sequence) position: , mismatch: 9, identity: 0.719

ctccgacgctgctctcctcagcttcggcttgg	CRISPR spacer
tcgcctcgctgcgctcctcaccttcggctccg	Protospacer
.. *  ****** ******* ********. *

29. spacer 4.8|760538|32|NZ_AP017372|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP015203 (Rhodococcus sp. 008 plasmid pR8L1, complete sequence) position: , mismatch: 9, identity: 0.719

agcggcacgtttaccatgcccgaagatgaaat	CRISPR spacer
agcggcacgtagaccatgcccgaacgccacgc	Protospacer
**********  ************ .. * ..

30. spacer 5.1|761987|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NC_013858 (Azospirillum sp. B510 plasmid pAB510d, complete sequence) position: , mismatch: 9, identity: 0.719

cggactcgacctcctccatcgagccgtaactc	CRISPR spacer
cttcgtcgacctccagcatcgagccgtagcgg	Protospacer
*    *********  ************.*

31. spacer 5.12|762658|32|NZ_AP017372|CRISPRCasFinder,CRT matches to MN032972 (Leviviridae sp. isolate H2_Rhizo_Litter_7_scaffold_10692 sequence) position: , mismatch: 9, identity: 0.719

tcccgcgtctataccgacaagagtttgggcgc	CRISPR spacer
cttcgtgtcaataccgacaagagtttctggac	Protospacer
...**.*** ****************  * .*

32. spacer 5.12|762658|32|NZ_AP017372|CRISPRCasFinder,CRT matches to MN033187 (Leviviridae sp. isolate H2_Rhizo_Litter_49_scaffold_9067 RNA-dependent RNA polymerase (H2RhizoLitter499067_000001) gene, complete cds; and hypothetical protein (H2RhizoLitter499067_000002) gene, partial cds) position: , mismatch: 9, identity: 0.719

tcccgcgtctataccgacaagagtttgggcgc	CRISPR spacer
cttcgtgtcaataccgacaagagtttctggac	Protospacer
...**.*** ****************  * .*

33. spacer 5.14|762780|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_AP022319 (Burkholderia sp. THE68 plasmid BTHE68_p1, complete sequence) position: , mismatch: 9, identity: 0.719

ataaccggcggcggtgagccgtcagatgagtg	CRISPR spacer
cacgcaggcggcggtgagccgtcaggtcaggt	Protospacer
   .* *******************.* **

34. spacer 5.14|762780|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_CP026091 (Ralstonia solanacearum strain IBSBF 2570 plasmid unnamed, complete sequence) position: , mismatch: 9, identity: 0.719

ataaccggcggcggtgagccgtcagatgagtg	CRISPR spacer
gagaccggcggcgctgagccgtcggacgtgct	Protospacer
. .********** *********.**.* *.

35. spacer 5.14|762780|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NC_014309 (Ralstonia solanacearum CFBP2957 plasmid RCFBPv3_mp, complete genome) position: , mismatch: 9, identity: 0.719

ataaccggcggcggtgagccgtcagatgagtg	CRISPR spacer
gagaccggcggcgctgagccgtcggacgtgct	Protospacer
. .********** *********.**.* *.

36. spacer 5.14|762780|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_CP026093 (Ralstonia solanacearum strain SFC plasmid unnamed, complete sequence) position: , mismatch: 9, identity: 0.719

ataaccggcggcggtgagccgtcagatgagtg	CRISPR spacer
gagaccggcggcgctgagccgtcggacgtgct	Protospacer
. .********** *********.**.* *.

37. spacer 5.14|762780|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_CP012940 (Ralstonia solanacearum strain UW163 plasmid unnamed, complete sequence) position: , mismatch: 9, identity: 0.719

ataaccggcggcggtgagccgtcagatgagtg	CRISPR spacer
gagaccggcggcgctgagccgtcggacgtgct	Protospacer
. .********** *********.**.* *.

38. spacer 5.14|762780|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_CP012944 (Ralstonia solanacearum strain IBSBF1503 plasmid unnamed, complete sequence) position: , mismatch: 9, identity: 0.719

ataaccggcggcggtgagccgtcagatgagtg	CRISPR spacer
gagaccggcggcgctgagccgtcggacgtgct	Protospacer
. .********** *********.**.* *.

39. spacer 5.14|762780|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NC_017575 (Ralstonia solanacearum Po82 megaplasmid, complete sequence) position: , mismatch: 9, identity: 0.719

ataaccggcggcggtgagccgtcagatgagtg	CRISPR spacer
gagaccggcggcgctgagccgtcggacgtgct	Protospacer
. .********** *********.**.* *.

40. spacer 5.14|762780|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_CP026308 (Ralstonia solanacearum strain IBSBF 2571 plasmid unnamed, complete sequence) position: , mismatch: 9, identity: 0.719

ataaccggcggcggtgagccgtcagatgagtg	CRISPR spacer
gagaccggcggcgctgagccgtcggacgtgct	Protospacer
. .********** *********.**.* *.

41. spacer 5.14|762780|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_CP051295 (Ralstonia solanacearum strain CIAT_078 plasmid megaplasmid, complete sequence) position: , mismatch: 9, identity: 0.719

ataaccggcggcggtgagccgtcagatgagtg	CRISPR spacer
gagaccggcggcgctgagccgtcggacgtgct	Protospacer
. .********** *********.**.* *.

42. spacer 5.17|762963|33|NZ_AP017372|CRISPRCasFinder,CRT matches to JQ067087 (Pseudomonas phage PaMx11, complete genome) position: , mismatch: 9, identity: 0.727

ttcgccggtagaaagctgattttcaagcgcgac	CRISPR spacer
ggtgccggtaacaagctgattttcaagctgccc	Protospacer
  .*******. ****************    *

43. spacer 5.21|763208|32|NZ_AP017372|CRISPRCasFinder,CRT,PILER-CR matches to MN694560 (Marine virus AFVG_250M172, complete genome) position: , mismatch: 9, identity: 0.719

ccctggcgcccggacgatgcccgtgtctatca	CRISPR spacer
gggcagagcccgggcgatgcccgtgtccatga	Protospacer
   ..* ******.*************.** *

44. spacer 5.27|763574|32|NZ_AP017372|CRISPRCasFinder,CRT,PILER-CR matches to NC_009620 (Sinorhizobium medicae WSM419 plasmid pSMED01, complete sequence) position: , mismatch: 9, identity: 0.719

tccggtaggggcataggacgtaaagcgaaccc	CRISPR spacer
gctgccgcgggcatgggacgtaacgcgaaccg	Protospacer
 *.* .. ******.******** *******

45. spacer 5.36|762535|33|NZ_AP017372|PILER-CR matches to MN586006 (Mycobacterium phage Bachome, complete genome) position: , mismatch: 9, identity: 0.727

gcgttcagctgctcgcggacacgctcttcgtca	CRISPR spacer
ttgttctcctgctcgcggacacgctcagcgatg	Protospacer
 .****  ******************  ** ..

46. spacer 5.1|761987|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_CP007130 (Gemmatirosa kalamazoonesis strain KBS708 plasmid 2, complete sequence) position: , mismatch: 10, identity: 0.688

cggactcgacctcctccatcgagccgtaactc	CRISPR spacer
gggacacgacctcctccatcgtgcgcaggcgg	Protospacer
 **** *************** **   ..*

47. spacer 5.8|762414|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NC_019849 (Sinorhizobium meliloti GR4 plasmid pRmeGR4d, complete sequence) position: , mismatch: 10, identity: 0.688

gacgacgaaaccattcgcgctagcgaagaata	CRISPR spacer
cttggcgaaaccattcgcgcgatcgaagggcc	Protospacer
  .*.*************** * *****...

48. spacer 5.8|762414|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_CP019586 (Sinorhizobium meliloti strain CCMM B554 (FSM-MA) plasmid pSymB, complete sequence) position: , mismatch: 10, identity: 0.688

gacgacgaaaccattcgcgctagcgaagaata	CRISPR spacer
cttggcgaaaccattcgcgcgatcgaagggcc	Protospacer
  .*.*************** * *****...

49. spacer 5.8|762414|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NC_017326 (Sinorhizobium meliloti SM11 plasmid pSmeSM11d, complete sequence) position: , mismatch: 10, identity: 0.688

gacgacgaaaccattcgcgctagcgaagaata	CRISPR spacer
cttggcgaaaccattcgcgcgatcgaagggcc	Protospacer
  .*.*************** * *****...

50. spacer 5.8|762414|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NC_017323 (Sinorhizobium meliloti BL225C plasmid pSINMEB02, complete sequence) position: , mismatch: 10, identity: 0.688

gacgacgaaaccattcgcgctagcgaagaata	CRISPR spacer
cttggcgaaaccattcgcgcgatcgaagggcc	Protospacer
  .*.*************** * *****...

51. spacer 5.8|762414|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_CP021828 (Sinorhizobium meliloti strain KH35c plasmid psymB, complete sequence) position: , mismatch: 10, identity: 0.688

gacgacgaaaccattcgcgctagcgaagaata	CRISPR spacer
cttggcgaaaccattcgcgcgatcgaagggcc	Protospacer
  .*.*************** * *****...

52. spacer 5.8|762414|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_CP021820 (Sinorhizobium meliloti strain M162 plasmid psymB, complete sequence) position: , mismatch: 10, identity: 0.688

gacgacgaaaccattcgcgctagcgaagaata	CRISPR spacer
cttggcgaaaccattcgcgcgatcgaagggcc	Protospacer
  .*.*************** * *****...

53. spacer 5.8|762414|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_CP021831 (Sinorhizobium meliloti strain HM006 plasmid psymB, complete sequence) position: , mismatch: 10, identity: 0.688

gacgacgaaaccattcgcgctagcgaagaata	CRISPR spacer
cttggcgaaaccattcgcgcgatcgaagggcc	Protospacer
  .*.*************** * *****...

54. spacer 5.8|762414|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_CP021814 (Sinorhizobium meliloti strain M270 plasmid psymB, complete sequence) position: , mismatch: 10, identity: 0.688

gacgacgaaaccattcgcgctagcgaagaata	CRISPR spacer
cttggcgaaaccattcgcgcgatcgaagggcc	Protospacer
  .*.*************** * *****...

55. spacer 5.8|762414|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_CP021795 (Sinorhizobium meliloti strain USDA1157 plasmid psymB, complete sequence) position: , mismatch: 10, identity: 0.688

gacgacgaaaccattcgcgctagcgaagaata	CRISPR spacer
cttggcgaaaccattcgcgcgatcgaagggcc	Protospacer
  .*.*************** * *****...

56. spacer 5.8|762414|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_CP021806 (Sinorhizobium meliloti strain T073 plasmid psymB, complete sequence) position: , mismatch: 10, identity: 0.688

gacgacgaaaccattcgcgctagcgaagaata	CRISPR spacer
cttggcgaaaccattcgcgcgatcgaagggcc	Protospacer
  .*.*************** * *****...

57. spacer 5.14|762780|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_AP022319 (Burkholderia sp. THE68 plasmid BTHE68_p1, complete sequence) position: , mismatch: 10, identity: 0.688

ataaccggcggcggtgagccgtcagatgagtg	CRISPR spacer
gacgccgggcgcggtgagccgtcagattcgcc	Protospacer
.  .****  *****************  *.

58. spacer 5.14|762780|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_CP050100 (Rhizobium leguminosarum bv. trifolii strain 9B plasmid pRL9b3, complete sequence) position: , mismatch: 10, identity: 0.688

ataaccggcggcggtgagccgtcagatgagtg	CRISPR spacer
ggtgccggcggcggtgaaccgacagattcgat	Protospacer
.  .*************.*** *****  *

59. spacer 5.14|762780|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_CP025017 (Rhizobium leguminosarum strain Norway plasmid pRLN5, complete sequence) position: , mismatch: 10, identity: 0.688

ataaccggcggcggtgagccgtcagatgagtg	CRISPR spacer
ggtgccggcggcggtgaaccggcagattcgat	Protospacer
.  .*************.*** *****  *

60. spacer 5.14|762780|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_CP053443 (Rhizobium leguminosarum bv. trifolii strain CC275e plasmid pRltCC275eC, complete sequence) position: , mismatch: 10, identity: 0.688

ataaccggcggcggtgagccgtcagatgagtg	CRISPR spacer
ggtgccggcggcggtgaaccggcagattcgat	Protospacer
.  .*************.*** *****  *

61. spacer 5.14|762780|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_CP044308 (Escherichia coli strain C27A plasmid pC27A-3, complete sequence) position: , mismatch: 10, identity: 0.688

ataaccggcggcggtgagccgtcagatgagtg	CRISPR spacer
actgacggcggcggggagccgccagatgtacc	Protospacer
*. . ********* ******.****** ..

62. spacer 5.14|762780|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_CP018232 (Rhizobium leguminosarum strain Vaf-108 plasmid unnamed4, complete sequence) position: , mismatch: 10, identity: 0.688

ataaccggcggcggtgagccgtcagatgagtg	CRISPR spacer
ggtgccggcggcggtgaaccggcagattcgat	Protospacer
.  .*************.*** *****  *

63. spacer 5.16|762902|32|NZ_AP017372|CRISPRCasFinder,CRT matches to MF399199 (Acinetobacter baumannii strain D46 plasmid pD46-4, complete sequence) position: , mismatch: 10, identity: 0.688

gttgagttgcaaaccaccgacctgcctacaga	CRISPR spacer
caatagttgcaaaccacagacctaccttaaac	Protospacer
    ************* *****.***  *.

64. spacer 5.16|762902|32|NZ_AP017372|CRISPRCasFinder,CRT matches to MF399199 (Acinetobacter baumannii strain D46 plasmid pD46-4, complete sequence) position: , mismatch: 10, identity: 0.688

gttgagttgcaaaccaccgacctgcctacaga	CRISPR spacer
caatagttgcaaaccacagacctaccttaaac	Protospacer
    ************* *****.***  *.

65. spacer 5.16|762902|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_KT601170 (Staphylococcus sciuri strain wo28-3 plasmid pwo28-3, complete sequence) position: , mismatch: 10, identity: 0.688

gttgagttgcaaaccaccgacctgcctacaga	CRISPR spacer
caatacctgcaaaccaccaacctgcatacaac	Protospacer
    * .***********.****** ****.

66. spacer 5.16|762902|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_KX982169 (Staphylococcus sciuri strain wo27-9 plasmid pWo27-9, complete sequence) position: , mismatch: 10, identity: 0.688

gttgagttgcaaaccaccgacctgcctacaga	CRISPR spacer
caatacctgcaaaccaccaacctgcatacaac	Protospacer
    * .***********.****** ****.

67. spacer 5.16|762902|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_KX982171 (Staphylococcus sciuri strain wo28-1 plasmid pWo28-1, complete sequence) position: , mismatch: 10, identity: 0.688

gttgagttgcaaaccaccgacctgcctacaga	CRISPR spacer
caatacctgcaaaccaccaacctgcatacaac	Protospacer
    * .***********.****** ****.

68. spacer 5.16|762902|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_CP040051 (Acinetobacter baumannii strain VB16141 plasmid unnamed1, complete sequence) position: , mismatch: 10, identity: 0.688

gttgagttgcaaaccaccgacctgcctacaga	CRISPR spacer
caatagttgcaaaccacagacctaccttaaac	Protospacer
    ************* *****.***  *.

69. spacer 5.16|762902|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_CP040051 (Acinetobacter baumannii strain VB16141 plasmid unnamed1, complete sequence) position: , mismatch: 10, identity: 0.688

gttgagttgcaaaccaccgacctgcctacaga	CRISPR spacer
caatagttgcaaaccacagacctaccttaaac	Protospacer
    ************* *****.***  *.

70. spacer 5.16|762902|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_KX426227 (Acinetobacter lwoffii strain ED23-35 plasmid pALWED1.1, complete sequence) position: , mismatch: 10, identity: 0.688

gttgagttgcaaaccaccgacctgcctacaga	CRISPR spacer
caatagttgcaaaccacagacctaccttaaac	Protospacer
    ************* *****.***  *.

71. spacer 5.16|762902|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_AP014650 (Acinetobacter baumannii strain IOMTU433 plasmid pIOMTU433, complete sequence) position: , mismatch: 10, identity: 0.688

gttgagttgcaaaccaccgacctgcctacaga	CRISPR spacer
caatagttgcaaaccacagacctaccttaaac	Protospacer
    ************* *****.***  *.

72. spacer 5.16|762902|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_AP014650 (Acinetobacter baumannii strain IOMTU433 plasmid pIOMTU433, complete sequence) position: , mismatch: 10, identity: 0.688

gttgagttgcaaaccaccgacctgcctacaga	CRISPR spacer
caatagttgcaaaccacagacctaccttaaac	Protospacer
    ************* *****.***  *.

73. spacer 5.16|762902|32|NZ_AP017372|CRISPRCasFinder,CRT matches to CP033569 (Acinetobacter pittii strain 2014N21-145 plasmid p2014N21-145-1, complete sequence) position: , mismatch: 10, identity: 0.688

gttgagttgcaaaccaccgacctgcctacaga	CRISPR spacer
caatagttgcaaaccacagacctaccttaaac	Protospacer
    ************* *****.***  *.

74. spacer 5.16|762902|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_CP012007 (Acinetobacter baumannii strain Ab04-mff plasmid pAB04-1, complete sequence) position: , mismatch: 10, identity: 0.688

gttgagttgcaaaccaccgacctgcctacaga	CRISPR spacer
caatagttgcaaaccacagacctaccttaaac	Protospacer
    ************* *****.***  *.

75. spacer 5.16|762902|32|NZ_AP017372|CRISPRCasFinder,CRT matches to CP040054 (Acinetobacter baumannii strain VB35179 plasmid unnamed1, complete sequence) position: , mismatch: 10, identity: 0.688

gttgagttgcaaaccaccgacctgcctacaga	CRISPR spacer
caatagttgcaaaccacagacctaccttaaac	Protospacer
    ************* *****.***  *.

76. spacer 5.16|762902|32|NZ_AP017372|CRISPRCasFinder,CRT matches to CP040054 (Acinetobacter baumannii strain VB35179 plasmid unnamed1, complete sequence) position: , mismatch: 10, identity: 0.688

gttgagttgcaaaccaccgacctgcctacaga	CRISPR spacer
caatagttgcaaaccacagacctaccttaaac	Protospacer
    ************* *****.***  *.

77. spacer 5.16|762902|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_CP050433 (Acinetobacter baumannii strain PM194229 plasmid pPM194229_1, complete sequence) position: , mismatch: 10, identity: 0.688

gttgagttgcaaaccaccgacctgcctacaga	CRISPR spacer
caatagttgcaaaccacagacctaccttaaac	Protospacer
    ************* *****.***  *.

78. spacer 5.16|762902|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_CP050386 (Acinetobacter baumannii strain VB82 plasmid pVB82_1, complete sequence) position: , mismatch: 10, identity: 0.688

gttgagttgcaaaccaccgacctgcctacaga	CRISPR spacer
caatagttgcaaaccacagacctaccttaaac	Protospacer
    ************* *****.***  *.

79. spacer 5.16|762902|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_KU744946 (Acinetobacter baumannii strain A297 (RUH875) plasmid pA297-3 clone Global clone 1 (GC1), complete sequence) position: , mismatch: 10, identity: 0.688

gttgagttgcaaaccaccgacctgcctacaga	CRISPR spacer
caatagttgcaaaccacagacctaccttaaac	Protospacer
    ************* *****.***  *.

80. spacer 5.16|762902|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_KU744946 (Acinetobacter baumannii strain A297 (RUH875) plasmid pA297-3 clone Global clone 1 (GC1), complete sequence) position: , mismatch: 10, identity: 0.688

gttgagttgcaaaccaccgacctgcctacaga	CRISPR spacer
caatagttgcaaaccacagacctaccttaaac	Protospacer
    ************* *****.***  *.

81. spacer 5.16|762902|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_CP020596 (Acinetobacter baumannii strain HWBA8 plasmid pHWBA8_1, complete sequence) position: , mismatch: 10, identity: 0.688

gttgagttgcaaaccaccgacctgcctacaga	CRISPR spacer
caatagttgcaaaccacagacctaccttaaac	Protospacer
    ************* *****.***  *.

82. spacer 5.16|762902|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_CP040260 (Acinetobacter baumannii strain P7774 plasmid unnamed1, complete sequence) position: , mismatch: 10, identity: 0.688

gttgagttgcaaaccaccgacctgcctacaga	CRISPR spacer
caatagttgcaaaccacagacctaccttaaac	Protospacer
    ************* *****.***  *.

83. spacer 5.16|762902|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_KT779035 (Acinetobacter baumannii strain D4 plasmid pD4, complete sequence) position: , mismatch: 10, identity: 0.688

gttgagttgcaaaccaccgacctgcctacaga	CRISPR spacer
caatagttgcaaaccacagacctaccttaaac	Protospacer
    ************* *****.***  *.

84. spacer 5.16|762902|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NZ_MK323043 (Acinetobacter baumannii strain Acb-45063 plasmid pAb45063_b, complete sequence) position: , mismatch: 10, identity: 0.688

gttgagttgcaaaccaccgacctgcctacaga	CRISPR spacer
caatagttgcaaaccacagacctaccttaaac	Protospacer
    ************* *****.***  *.

85. spacer 5.19|763086|32|NZ_AP017372|CRISPRCasFinder,CRT,PILER-CR matches to NC_016626 (Burkholderia sp. YI23 plasmid byi_1p, complete sequence) position: , mismatch: 10, identity: 0.688

attacggcacggggcgatcagggaaacgggtc	CRISPR spacer
cgaacggcacgaggcgatcatggaaattaccc	Protospacer
   ********.******** *****. . .*

86. spacer 5.24|763391|32|NZ_AP017372|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP044079 (Paracoccus yeei strain FDAARGOS_643 plasmid unnamed2, complete sequence) position: , mismatch: 10, identity: 0.688

gcgatggagctgtttggcgcgcgctactttag	CRISPR spacer
cacatggtgctgtttggcccgcgctatcgcgg	Protospacer
   **** ********** *******.. ..*

87. spacer 5.40|762779|33|NZ_AP017372|PILER-CR matches to NZ_AP022319 (Burkholderia sp. THE68 plasmid BTHE68_p1, complete sequence) position: , mismatch: 10, identity: 0.697

gataaccggcggcggtgagccgtcagatgagtg	CRISPR spacer
tcacgcaggcggcggtgagccgtcaggtcaggt	Protospacer
    .* *******************.* **

88. spacer 4.6|760416|32|NZ_AP017372|CRISPRCasFinder,CRT,PILER-CR matches to MG065659 (UNVERIFIED: Campylobacter phage C5, complete genome) position: , mismatch: 11, identity: 0.656

cgcgtctttagccgccgcctctgcgccttctt	CRISPR spacer
gattcgtttaaccgccgcctcagcgccttggg	Protospacer
 .. . ****.********** *******

89. spacer 4.6|760416|32|NZ_AP017372|CRISPRCasFinder,CRT,PILER-CR matches to MG065655 (UNVERIFIED: Campylobacter phage C2, complete genome) position: , mismatch: 11, identity: 0.656

cgcgtctttagccgccgcctctgcgccttctt	CRISPR spacer
gattcgtttaaccgccgcctcagcgccttggg	Protospacer
 .. . ****.********** *******

90. spacer 4.6|760416|32|NZ_AP017372|CRISPRCasFinder,CRT,PILER-CR matches to MG065666 (UNVERIFIED: Campylobacter phage A12a, complete genome) position: , mismatch: 11, identity: 0.656

cgcgtctttagccgccgcctctgcgccttctt	CRISPR spacer
gattcgtttaaccgccgcctcagcgccttggg	Protospacer
 .. . ****.********** *******

91. spacer 4.6|760416|32|NZ_AP017372|CRISPRCasFinder,CRT,PILER-CR matches to KJ190158 (Escherichia phage vB_EcoM_FFH2, complete genome) position: , mismatch: 11, identity: 0.656

cgcgtctttagccgccgcctctgcgccttctt	CRISPR spacer
gattcgtttaaccgccgcctcagcgccttggg	Protospacer
 .. . ****.********** *******

92. spacer 4.6|760416|32|NZ_AP017372|CRISPRCasFinder,CRT,PILER-CR matches to MG065654 (UNVERIFIED: Campylobacter phage C15, complete genome) position: , mismatch: 11, identity: 0.656

cgcgtctttagccgccgcctctgcgccttctt	CRISPR spacer
gattcgtttaaccgccgcctcagcgccttggg	Protospacer
 .. . ****.********** *******

93. spacer 4.9|760599|32|NZ_AP017372|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP022605 (Ochrobactrum quorumnocens strain A44 plasmid unnamed1, complete sequence) position: , mismatch: 11, identity: 0.656

caatcttagcactgtcaagatcgacggactgg	CRISPR spacer
acatcttaacactttcaagatcgactcctgaa	Protospacer
  ******.**** ***********   . ..

94. spacer 5.1|761987|32|NZ_AP017372|CRISPRCasFinder,CRT matches to NC_020062 (Rhizobium tropici CIAT 899 plasmid pRtrCIAT899c, complete sequence) position: , mismatch: 11, identity: 0.656

cggactcgacctcctccatcgagccgtaactc	CRISPR spacer
tctcctcgaccttctccatcgaggcgttgaaa	Protospacer
.   ********.********** *** .

Prophage detection

Region

Region Position

Protein_number

Hit_taxonomy

Key_proteins

Att_site

Prophage annotation

DBSCAN-SWA_1

340689 : 389155

Escherichia_phage(28.57%)

transposase,holin

The bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_096407493.1\|340689_341673_-\|transposase	Rpn family recombination-promoting nuclease/putative transposase	NA	NA	NA	NA
WP_162549281.1\|343528_343972_-	rhodanese-like domain-containing protein	NA	NA	NA	NA
WP_096407499.1\|343968_344565_-	DedA family protein	NA	NA	NA	NA
WP_109962906.1\|344549_346085_-	glycogen synthase GlgA	NA	NA	NA	NA
WP_109962907.1\|346208_346565_-	alpha amylase C-terminal domain-containing protein	NA	NA	NA	NA
WP_096407506.1\|348458_349724_+	glucose-1-phosphate adenylyltransferase	NA	NA	NA	NA
WP_096407509.1\|349710_351477_+	glycoside hydrolase	NA	NA	NA	NA
WP_096407511.1\|351473_353033_+	4-alpha-glucanotransferase	NA	NA	NA	NA
WP_096407514.1\|353393_355943_-	alpha-glucan family phosphorylase	NA	NA	NA	NA
WP_096407516.1\|356933_357164_-\|transposase	Rpn family recombination-promoting nuclease/putative transposase	NA	NA	NA	NA
WP_096407519.1\|357185_357506_-	hypothetical protein	NA	NA	NA	NA
WP_096407521.1\|358004_358421_-	PIN domain-containing protein	NA	NA	NA	NA
WP_096410287.1\|358420_358696_-	type II toxin-antitoxin system Phd/YefM family antitoxin	NA	NA	NA	NA
WP_096407525.1\|359166_359364_+	DUF2283 domain-containing protein	NA	NA	NA	NA
WP_162549282.1\|359702_360023_-	hypothetical protein	NA	NA	NA	NA
WP_096407530.1\|360091_360388_-\|transposase	Rpn family recombination-promoting nuclease/putative transposase	S5VY82	Leptospira_phage	1.7e-06	34.2
WP_162549283.1\|360770_361163_+	hypothetical protein	NA	NA	NA	NA
WP_096407535.1\|361732_362185_-	helix-turn-helix domain-containing protein	K4ICM4	Acidithiobacillus_phage	2.0e-30	51.0
WP_096410288.1\|363045_364041_-	DUF4351 domain-containing protein	NA	NA	NA	NA
WP_096407540.1\|365173_365476_+	helix-turn-helix transcriptional regulator	NA	NA	NA	NA
WP_096407543.1\|365575_365995_-	hypothetical protein	NA	NA	NA	NA
WP_162549247.1\|366068_366347_-	hypothetical protein	NA	NA	NA	NA
WP_096407547.1\|366480_366768_+	HigA family addiction module antidote protein	A0A2P1MXE5	Escherichia_phage	5.8e-12	46.8
WP_096407549.1\|366961_367393_-	type II toxin-antitoxin system VapC family toxin	NA	NA	NA	NA
WP_096407553.1\|367822_368122_+	nucleotidyltransferase domain-containing protein	NA	NA	NA	NA
WP_162549284.1\|368176_368812_-	sulfotransferase family 2 domain-containing protein	NA	NA	NA	NA
WP_162549285.1\|369092_369734_-	hypothetical protein	NA	NA	NA	NA
WP_162549286.1\|369819_370800_-	glycosyltransferase	NA	NA	NA	NA
WP_096407561.1\|370887_372210_-	hypothetical protein	NA	NA	NA	NA
WP_096407563.1\|372353_373454_-	phosphotransferase	NA	NA	NA	NA
WP_162549287.1\|373482_374865_-	O-antigen ligase family protein	NA	NA	NA	NA
WP_096407567.1\|374857_375778_-	FkbM family methyltransferase	NA	NA	NA	NA
WP_162549288.1\|375826_376612_-	hypothetical protein	M4QRC6	Tetraselmis_viridis_virus	1.0e-26	30.1
WP_096407569.1\|376826_377447_-	gamma-glutamyl-gamma-aminobutyrate hydrolase family protein	NA	NA	NA	NA
WP_096407571.1\|377531_378059_-	hypothetical protein	NA	NA	NA	NA
WP_096407573.1\|378539_379211_+	hypothetical protein	NA	NA	NA	NA
WP_096407575.1\|379432_380182_-	class I SAM-dependent methyltransferase	NA	NA	NA	NA
WP_109962847.1\|380442_381384_-\|transposase	ISL3 family transposase	Q6V7R1	Burkholderia_virus	1.6e-10	25.8
WP_096409948.1\|381408_382188_-	ATP-binding protein	U5N3V8	Enterobacteria_phage	1.3e-34	36.6
WP_096409949.1\|382168_383686_-\|transposase	IS21 family transposase	A0A2L1IVA1	Escherichia_phage	1.1e-27	33.6
WP_096407579.1\|385245_386211_-	CDP-glycerol glycerophosphotransferase family protein	NA	NA	NA	NA
WP_162549289.1\|387159_388017_+	hypothetical protein	NA	NA	NA	NA
WP_096407583.1\|388405_389155_-\|holin	phosphocholine cytidylyltransferase family protein	NA	NA	NA	NA

DBSCAN-SWA_2

1511921 : 1555736

Rhizobium_phage(16.67%)

transposase,integrase

attL 1526332:1526346|attR 1549191:1549205

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_096409492.1\|1511921_1512215_+\|integrase	tyrosine-type recombinase/integrase	NA	NA	NA	NA
WP_096409495.1\|1513385_1514321_+	hypothetical protein	NA	NA	NA	NA
WP_096409498.1\|1515383_1516754_+\|transposase	IS1380 family transposase	NA	NA	NA	NA
WP_096409500.1\|1518202_1518487_+	hypothetical protein	NA	NA	NA	NA
WP_162549421.1\|1518804_1519131_+	hypothetical protein	NA	NA	NA	NA
WP_096409502.1\|1519057_1519381_-\|transposase	transposase	NA	NA	NA	NA
WP_096409503.1\|1519605_1519977_+	hypothetical protein	NA	NA	NA	NA
WP_096409505.1\|1520338_1520836_-	DNA repair protein RadC	NA	NA	NA	NA
WP_096409506.1\|1520958_1522731_-	VWA domain-containing protein	NA	NA	NA	NA
WP_096409508.1\|1522820_1523828_-	DUF3150 domain-containing protein	NA	NA	NA	NA
WP_096409509.1\|1523965_1524925_-	AAA family ATPase	L7TKP0	Rhizobium_phage	6.7e-28	31.3
WP_179948759.1\|1525012_1525966_-	hydrolase or metal-binding protein	NA	NA	NA	NA
WP_096409511.1\|1526063_1527098_-	YqaJ viral recombinase family protein	Q0H280	Geobacillus_phage	3.9e-50	40.4
1526332:1526346	attL	NA	NA	NA	NA
WP_162549422.1\|1527081_1527441_-	hypothetical protein	NA	NA	NA	NA
WP_162549423.1\|1528206_1528920_+	inovirus-type Gp2 protein	NA	NA	NA	NA
WP_162549424.1\|1529732_1530488_-	hypothetical protein	NA	NA	NA	NA
WP_162549425.1\|1531638_1532322_+	inovirus-type Gp2 protein	NA	NA	NA	NA
WP_096410365.1\|1532575_1532944_+	helix-turn-helix domain-containing protein	NA	NA	NA	NA
WP_096409517.1\|1533829_1535188_+	hypothetical protein	NA	NA	NA	NA
WP_096409518.1\|1535276_1535534_-	hypothetical protein	NA	NA	NA	NA
WP_096409520.1\|1535782_1536376_-	hypothetical protein	NA	NA	NA	NA
WP_162549426.1\|1536536_1536953_-	hypothetical protein	NA	NA	NA	NA
WP_162549427.1\|1537726_1538488_+	outer membrane beta-barrel protein	NA	NA	NA	NA
WP_096409525.1\|1538749_1539121_+	hypothetical protein	NA	NA	NA	NA
WP_096409526.1\|1539285_1540362_+\|transposase	IS3 family transposase	U5P429	Shigella_phage	4.3e-07	25.5
WP_096409527.1\|1540566_1540863_+	WGR domain-containing protein	NA	NA	NA	NA
WP_096409528.1\|1540859_1541060_-	hypothetical protein	NA	NA	NA	NA
WP_162549248.1\|1541149_1541302_-	hypothetical protein	NA	NA	NA	NA
WP_162549419.1\|1541458_1541917_-	helix-turn-helix transcriptional regulator	NA	NA	NA	NA
WP_162549420.1\|1542210_1542405_+	DUF4224 domain-containing protein	NA	NA	NA	NA
WP_096409492.1\|1542361_1542655_+\|integrase	tyrosine-type recombinase/integrase	NA	NA	NA	NA
WP_096409530.1\|1543824_1544760_+	hypothetical protein	NA	NA	NA	NA
WP_096409531.1\|1545467_1548560_-	hypothetical protein	A0A1B1IUG5	uncultured_Mediterranean_phage	1.4e-10	34.3
WP_096409533.1\|1549405_1552879_+	class I SAM-dependent DNA methyltransferase	Q6NE04	Leptospira_phage	1.9e-32	23.5
1549191:1549205	attR	NA	NA	NA	NA
WP_096409534.1\|1552921_1553218_+	hypothetical protein	NA	NA	NA	NA
WP_096409535.1\|1554218_1555736_+\|transposase	IS21 family transposase	A0A2L1IVA1	Escherichia_phage	1.8e-27	33.6

DBSCAN-SWA_3

1627203 : 1637991

uncultured_Mediterranean_phage(57.14%)

tRNA

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_096409593.1\|1627203_1628184_-	cysteine synthase A	A0A1X9I5K7	Streptococcus_phage	1.3e-42	34.6
WP_096409594.1\|1628276_1629233_-	protein translocase subunit SecF	A0A1B1IVP7	uncultured_Mediterranean_phage	9.9e-48	42.8
WP_096409595.1\|1629235_1631113_-	protein translocase subunit SecD	NA	NA	NA	NA
WP_096409596.1\|1631116_1631461_-	preprotein translocase subunit YajC	A0A1B1IVR5	uncultured_Mediterranean_phage	1.3e-10	39.8
WP_096409597.1\|1631515_1631893_-	preprotein translocase subunit YajC	A0A1B1IVR5	uncultured_Mediterranean_phage	3.6e-09	42.0
WP_096410370.1\|1631971_1633081_-\|tRNA	tRNA guanosine(34) transglycosylase Tgt	A0A1B1IVQ4	uncultured_Mediterranean_phage	8.4e-91	47.9
WP_096409598.1\|1633135_1633741_-	carbonic anhydrase	NA	NA	NA	NA
WP_096409599.1\|1633925_1635614_+	diguanylate cyclase	A0A127AWB9	Bacillus_phage	9.7e-14	33.7
WP_096409600.1\|1635651_1637991_+	response regulator	Q8QKV7	Ectocarpus_siliculosus_virus	1.1e-34	30.2

DBSCAN-SWA_4

2011382 : 2058504

Staphylococcus_phage(22.22%)

tRNA,plate,protease

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_096409876.1\|2011382_2011838_-\|protease	ClpXP protease specificity-enhancing factor	A0A1S5R3H3	Pseudomonas_phage	6.4e-29	58.8
WP_096409877.1\|2011859_2012459_-	glutathione S-transferase N-terminal domain-containing protein	NA	NA	NA	NA
WP_096409878.1\|2012543_2013275_-	cytochrome c1	NA	NA	NA	NA
WP_096409879.1\|2013271_2014516_-	cytochrome bc complex cytochrome b subunit	NA	NA	NA	NA
WP_096409880.1\|2014512_2015136_-	ubiquinol-cytochrome c reductase iron-sulfur subunit	NA	NA	NA	NA
WP_096409881.1\|2015296_2016055_-	Nif3-like dinuclear metal center hexameric protein	NA	NA	NA	NA
WP_096410400.1\|2016319_2017573_+	trypsin-like peptidase domain-containing protein	A0A1B1IRD3	uncultured_Mediterranean_phage	3.4e-11	33.6
WP_096409882.1\|2017766_2018864_-	histidinol-phosphate transaminase	NA	NA	NA	NA
WP_096409883.1\|2018860_2020177_-	histidinol dehydrogenase	NA	NA	NA	NA
WP_096409884.1\|2020201_2020849_-	ATP phosphoribosyltransferase	NA	NA	NA	NA
WP_096409885.1\|2020864_2022121_-	UDP-N-acetylglucosamine 1-carboxyvinyltransferase	NA	NA	NA	NA
WP_096409886.1\|2022124_2022463_-	STAS domain-containing protein	NA	NA	NA	NA
WP_096409887.1\|2022462_2023086_-	ABC transporter substrate-binding protein	NA	NA	NA	NA
WP_096409888.1\|2023213_2023669_-	outer membrane lipid asymmetry maintenance protein MlaD	NA	NA	NA	NA
WP_096409889.1\|2023686_2024463_-	lipid asymmetry maintenance ABC transporter permease subunit MlaE	NA	NA	NA	NA
WP_096410401.1\|2024459_2025281_-	ATP-binding cassette domain-containing protein	G9BWD6	Planktothrix_phage	5.2e-21	31.8
WP_096409890.1\|2025506_2026541_+	KpsF/GutQ family sugar-phosphate isomerase	E5E465	Acinetobacter_phage	8.9e-18	37.2
WP_096410402.1\|2026546_2027086_+	HAD hydrolase family protein	A0A140XBD6	Dickeya_phage	6.7e-17	33.6
WP_096409891.1\|2027115_2027688_+	LPS export ABC transporter periplasmic protein LptC	NA	NA	NA	NA
WP_096409892.1\|2027665_2028178_+	lipopolysaccharide transport periplasmic protein LptA	NA	NA	NA	NA
WP_096409893.1\|2028181_2028907_+	LPS export ABC transporter ATP-binding protein	A0A2H4PQG7	Staphylococcus_phage	1.6e-21	28.8
WP_096409894.1\|2028962_2030435_+	RNA polymerase factor sigma-54	NA	NA	NA	NA
WP_096409895.1\|2030447_2030795_+	ribosome-associated translation inhibitor RaiA	NA	NA	NA	NA
WP_096409896.1\|2030822_2031293_+	PTS sugar transporter subunit IIA	NA	NA	NA	NA
WP_162549471.1\|2031289_2031955_+	hypothetical protein	NA	NA	NA	NA
WP_096410403.1\|2031945_2032800_+	RNase adapter RapZ	A0A1P8D5W0	Corynebacterium_phage	4.3e-10	28.5
WP_096409898.1\|2032796_2033186_+	PTS fructose transporter subunit IIA	NA	NA	NA	NA
WP_096409899.1\|2033197_2033479_+	HPr family phosphocarrier protein	NA	NA	NA	NA
WP_096410404.1\|2033480_2034767_-\|protease	metalloprotease PmbA	NA	NA	NA	NA
WP_096409900.1\|2034829_2036275_-\|protease	metalloprotease TldD	NA	NA	NA	NA
WP_096410405.1\|2036314_2037097_-	carbon-nitrogen hydrolase family protein	NA	NA	NA	NA
WP_096409901.1\|2037365_2040890_-	hypothetical protein	NA	NA	NA	NA
WP_096409902.1\|2040891_2042352_-	ribonuclease G	NA	NA	NA	NA
WP_096409903.1\|2042348_2042936_-	septum formation inhibitor Maf	NA	NA	NA	NA
WP_096409904.1\|2043001_2043463_-	23S rRNA (pseudouridine(1915)-N(3))-methyltransferase RlmH	NA	NA	NA	NA
WP_096409905.1\|2043623_2043974_-	ribosome silencing factor	NA	NA	NA	NA
WP_170113012.1\|2043995_2044643_-	nicotinate-nucleotide adenylyltransferase	NA	NA	NA	NA
WP_096409907.1\|2044682_2045960_-	glutamate-5-semialdehyde dehydrogenase	A0A1X9I5D4	Streptococcus_phage	3.9e-92	45.4
WP_096409908.1\|2046065_2047073_-	DNA polymerase III subunit delta	NA	NA	NA	NA
WP_162549472.1\|2047075_2047606_-	hypothetical protein	NA	NA	NA	NA
WP_096410406.1\|2047592_2050064_-\|tRNA	leucine--tRNA ligase	A0A2H4PQS0	Staphylococcus_phage	1.1e-199	45.0
WP_096409910.1\|2050262_2050799_+	zinc ribbon-containing protein	NA	NA	NA	NA
WP_096409911.1\|2051013_2053044_-	hypothetical protein	NA	NA	NA	NA
WP_096409912.1\|2053263_2055411_-	type VI secretion system tip protein VgrG	NA	NA	NA	NA
WP_096409913.1\|2055421_2056351_-\|plate	type VI secretion system baseplate subunit TssG	NA	NA	NA	NA
WP_096409914.1\|2056332_2058057_-\|plate	type VI secretion system baseplate subunit TssF	NA	NA	NA	NA
WP_096409915.1\|2058063_2058504_-\|plate	type VI secretion system baseplate subunit TssE	NA	NA	NA	NA

Anti-CRISPR protein detection

Acr ID	Acr position	Acr size	Homology with known anti	Neighbor HTH/AcRanker	Neighbor Aca	In prophage	Protospacer in prophage

Overview of predicted results

Overview of the results

Cas Category Instructions

Results visualization

1. NZ_AP017372

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection