CRISPRimmunity

Please click to download your results

Overview of predicted results

Overview of the results

Contig_ID	Contig_def	CRISPR array number	Contig Signature genes	Target MGE spacer number	Prophage number
NC_020543	Sphingomonas sp. MM-1 plasmid pISP2, complete sequence	0 crisprs	NA	0	0
NC_020563	Sphingomonas sp. MM-1 plasmid pISP4, complete sequence	1 crisprs	NA	1	1
NC_020544	Sphingomonas sp. MM-1 plasmid pISP3, complete sequence	0 crisprs	NA	0	0
NC_020561	Sphingomonas sp. MM-1, complete sequence	6 crisprs	csa3,cas9,cas1,cas2,DinG,DEDDh,RT,WYL	12	6
NC_020542	Sphingomonas sp. MM-1 plasmid pISP0, complete sequence	0 crisprs	WYL	0	26
NC_020562	Sphingomonas sp. MM-1 plasmid pISP1, complete sequence	1 crisprs	csa3	1	0

Results visualization

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Crispr_ID: NC_020561_1

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_020561_1

157341-157431

Orphan

Consensus_repeat	Method
GGGGAGGGAGGCTGGCGAAATGGCGC	CRISPRCasFinder

1 spacers

The CRISPR arrays of NC_020561_1

>merge|NC_020561|1|157341-157431|CRISPRCasFinder
GGGGAGGGAGGCTGGCGAAATGGCGCTCCCCCAACATAACAGGAGCGCGCTGCGCGCGCCCGGCTGGGGAGGGAGGCTAGCGAAATGGCGC

>NC_020561|1|1|157341-157431|CRISPRCasFinder
GGGGAGGGAGGCTGGCGAAATGGCGC	TCCCCCAACATAACAGGAGCGCGCTGCGCGCGCCCGGCT
GGGGAGGGAGGCTAGCGAAATGGCGC

Protein	Signature genes	Signature genes Name	Protein_function
NC_020561.1\|WP_015456891.1\|149339_150341_-\|NADP-dependent-oxidoreductase	unknown	unknown	gnl\|CDD\|176191
NC_020561.1\|WP_187294044.1\|144733_146833_-\|PBP1A-family-penicillin-binding-protein	unknown	unknown	gnl\|CDD\|273955
NC_020561.1\|WP_015456902.1\|161461_162049_-\|EthD-domain-containing-protein	unknown	unknown	gnl\|CDD\|369213
NC_020561.1\|WP_015456889.1\|146905_148723_-\|DUF885-family-protein	unknown	unknown	gnl\|CDD\|227142
NC_020561.1\|WP_015456897.1\|156273_157122_+\|SDR-family-oxidoreductase	unknown	unknown	gnl\|CDD\|187627
NC_020561.1\|WP_015456894.1\|153054_153477_-\|acetyl-CoA-carboxylase-biotin-carboxyl-carrier-protein-subunit	unknown	unknown	gnl\|CDD\|133459
NC_020561.1\|WP_187294045.1\|165051_165933_-\|DMT-family-transporter	unknown	unknown	gnl\|CDD\|223769
NC_020561.1\|WP_015456890.1\|148839_149304_-\|nuclear-transport-factor-2-family-protein	unknown	unknown	gnl\|CDD\|379275
NC_020561.1\|WP_015456900.1\|159486_160734_+\|MFS-transporter	unknown	unknown	gnl\|CDD\|340929
NC_020561.1\|WP_015456898.1\|157497_157971_-\|Lrp/AsnC-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|224439
NC_020561.1\|WP_015456892.1\|150459_151431_-\|alpha/beta-hydrolase	unknown	unknown	gnl\|CDD\|369561
NC_020561.1\|WP_015456895.1\|153476_154952_-\|ATP-grasp-domain-containing-protein	unknown	unknown	gnl\|CDD\|227111
NC_020561.1\|WP_051128686.1\|155062_156274_+\|acyl-CoA-dehydrogenase-family-protein	unknown	unknown	gnl\|CDD\|173845
NC_020561.1\|WP_041865032.1\|151447_153055_-\|methylcrotonoyl-CoA-carboxylase	unknown	unknown	gnl\|CDD\|178415
NC_020561.1\|WP_107394544.1\|164199_164994_+\|PEPxxWA-CTERM-sorting-domain-containing-protein	unknown	unknown	gnl\|CDD\|377877
NC_020561.1\|WP_015456907.1\|166102_166819_+\|cytochrome-c-biogenesis-protein-CcsA	unknown	unknown	gnl\|CDD\|273492
NC_020561.1\|WP_015456899.1\|158566_159439_+\|helix-turn-helix-transcriptional-regulator	unknown	unknown	gnl\|CDD\|225117
NC_020561.1\|WP_015456904.1\|162892_163942_+\|Glu/Leu/Phe/Val-dehydrogenase	unknown	unknown	gnl\|CDD\|223411
NC_020561.1\|WP_015456903.1\|162182_162596_-\|Rrf2-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|224870
NC_020561.1\|WP_015456901.1\|160730_161477_+\|SDR-family-oxidoreductase	unknown	unknown	gnl\|CDD\|235546

Protein	Function_ID	Function_description	E-value
NC_020561.1\|WP_015456891.1\|149339_150341_-\|NADP-dependent-oxidoreductase	gnl\|CDD\|176191	cd05289, MDR_like_2, alcohol dehydrogenase and quinone reductase-like medium chain degydrogenases/reductases. Members identified as zinc-dependent alcohol dehydrogenases and quinone oxidoreductase. QOR catalyzes the conversion of a quinone + NAD(P)H to a hydroquinone + NAD(P)+. Quinones are cyclic diones derived from aromatic compounds. Membrane bound QOR actin the respiratory chains of bacteria and mitochondria, while soluble QOR acts to protect from toxic quinones (e.g. DT-diaphorase) or as a soluble eye-lens protein in some vertebrates (e.g. zeta-crystalin). QOR reduces quinones through a semi-quinone intermediate via a NAD(P)H-dependent single electron transfer. QOR is a member of the medium chain dehydrogenase/reductase family, but lacks the zinc-binding sites of the prototypical alcohol dehydrogenases of this group. NAD(P)(H)-dependent oxidoreductases are the major enzymes in the interconversion of alcohols and aldehydes, or ketones. Alcohol dehydrogenase in the liver converts ethanol and NAD+ to acetaldehyde and NADH, while in yeast and some other microorganisms ADH catalyzes the conversion acetaldehyde to ethanol in alcoholic fermentation. ADH is a member of the medium chain alcohol dehydrogenase family (MDR), which has a NAD(P)(H)-binding domain in a Rossmann fold of a beta-alpha form. The NAD(H)-binding region is comprised of 2 structurally similar halves, each of which contacts a mononucleotide. A GxGxxG motif after the first mononucleotide contact half allows the close contact of the coenzyme with the ADH backbone. The N-terminal catalytic domain has a distant homology to GroES. These proteins typically form dimers (typically higher plants, mammals) or tetramers (yeast, bacteria), and have 2 tightly bound zinc atoms per subunit, a catalytic zinc at the active site and a structural zinc in a lobe of the catalytic domain. NAD(H) binding occurs in the cleft between the catalytic and coenzyme-binding domains at the active site, and coenzyme binding induces a conformational closing of this cleft. Coenzyme binding typically precedes and contributes to substrate binding. In human ADH catalysis, the zinc ion helps coordinate the alcohol, followed by deprotonation of a histidine, the ribose of NAD, a serine, then the alcohol, which allows the transfer of a hydride to NAD+, creating NADH and a zinc-bound aldehyde or ketone. In yeast and some bacteria, the active site zinc binds an aldehyde, polarizing it, and leading to the reverse reaction.	6.86509e-99
NC_020561.1\|WP_187294044.1\|144733_146833_-\|PBP1A-family-penicillin-binding-protein	gnl\|CDD\|273955	TIGR02074, Includes:_Penicillin-insensitive_transglycosylase, penicillin-binding protein, 1A family. Bacterial that synthesize a cell wall of peptidoglycan (murein) generally have several transglycosylases and transpeptidases for the task. This family consists of bifunctional transglycosylase/transpeptidase penicillin-binding proteins (PBP). In the Proteobacteria, this family includes PBP 1A but not the paralogous PBP 1B (TIGR02071). This family also includes related proteins, often designated PBP 1A, from other bacterial lineages. [Cell envelope, Biosynthesis and degradation of murein sacculus and peptidoglycan].	0
NC_020561.1\|WP_015456902.1\|161461_162049_-\|EthD-domain-containing-protein	gnl\|CDD\|369213	pfam07110, EthD, EthD domain. This family consists of several bacterial sequences which are related to the EthD protein of Rhodococcus ruber. In Rhodococcus ruber, EthD is thought to be involved in the degradation of ethyl tert-butyl ether (ETBE). EthD synthesis is induced by ETBE but it's exact function is unknown, it is however thought to be essential to the ETBE degradation system.	1.68362e-08
NC_020561.1\|WP_015456889.1\|146905_148723_-\|DUF885-family-protein	gnl\|CDD\|227142	COG4805, COG4805, Uncharacterized protein conserved in bacteria [Function unknown].	0
NC_020561.1\|WP_015456897.1\|156273_157122_+\|SDR-family-oxidoreductase	gnl\|CDD\|187627	cd05369, TER_DECR_SDR_a, Trans-2-enoyl-CoA reductase (TER) and 2,4-dienoyl-CoA reductase (DECR), atypical (a) SDR. TTER is a peroxisomal protein with a proposed role in fatty acid elongation. Fatty acid synthesis is known to occur in the both endoplasmic reticulum and mitochondria; peroxisomal TER has been proposed as an additional fatty acid elongation system, it reduces the double bond at C-2 as the last step of elongation. This system resembles the mitochondrial system in that acetyl-CoA is used as a carbon donor. TER may also function in phytol metabolism, reducting phytenoyl-CoA to phytanoyl-CoA in peroxisomes. DECR processes double bonds in fatty acids to increase their utility in fatty acid metabolism; it reduces 2,4-dienoyl-CoA to an enoyl-CoA. DECR is active in mitochondria and peroxisomes. This subgroup has the Gly-rich NAD-binding motif of the classical SDR family, but does not display strong identity to the canonical active site tetrad, and lacks the characteristic Tyr at the usual position. SDRs are a functionally diverse family of oxidoreductases that have a single domain with a structurally conserved Rossmann fold (alpha/beta folding pattern with a central beta-sheet), an NAD(P)(H)-binding region, and a structurally diverse C-terminal region. Classical SDRs are typically about 250 residues long, while extended SDRS are approximately 350 residues. Sequence identity between different SDR enzymes are typically in the 15-30% range, but the enzymes share the Rossmann fold NAD-binding motif and characteristic NAD-binding and catalytic sequence patterns. These enzymes have a 3-glycine N-terminal NAD(P)(H)-binding pattern (typically, TGxxxGxG in classical SDRs and TGxxGxxG in extended SDRs), while substrate binding is in the C-terminal region. A critical catalytic Tyr residue (Tyr-151, human 15-hydroxyprostaglandin dehydrogenase (15-PGDH) numbering), is often found in a conserved YXXXK pattern. In addition to the Tyr and Lys, there is often an upstream Ser (Ser-138, 15-PGDH numbering) and/or an Asn (Asn-107, 15-PGDH numbering) or additional Ser, contributing to the active site. Substrates for these enzymes include sugars, steroids, alcohols, and aromatic compounds. The standard reaction mechanism is a proton relay involving the conserved Tyr and Lys, as well as Asn (or Ser). Some SDR family members, including 17 beta-hydroxysteroid dehydrogenase contain an additional helix-turn-helix motif that is not generally found among SDRs.	1.57891e-89
NC_020561.1\|WP_015456894.1\|153054_153477_-\|acetyl-CoA-carboxylase-biotin-carboxyl-carrier-protein-subunit	gnl\|CDD\|133459	cd06850, biotinyl_domain, The biotinyl-domain or biotin carboxyl carrier protein (BCCP) domain is present in all biotin-dependent enzymes, such as acetyl-CoA carboxylase, pyruvate carboxylase, propionyl-CoA carboxylase, methylcrotonyl-CoA carboxylase, geranyl-CoA carboxylase, oxaloacetate decarboxylase, methylmalonyl-CoA decarboxylase, transcarboxylase and urea amidolyase. This domain functions in transferring CO2 from one subsite to another, allowing carboxylation, decarboxylation, or transcarboxylation. During this process, biotin is covalently attached to a specific lysine.	2.10426e-19
NC_020561.1\|WP_187294045.1\|165051_165933_-\|DMT-family-transporter	gnl\|CDD\|223769	COG0697, RhaT, Permeases of the drug/metabolite transporter (DMT) superfamily [Carbohydrate transport and metabolism / Amino acid transport and metabolism / General function prediction only].	1.97461e-09
NC_020561.1\|WP_015456890.1\|148839_149304_-\|nuclear-transport-factor-2-family-protein	gnl\|CDD\|379275	pfam13577, SnoaL_4, SnoaL-like domain. This family contains a large number of proteins that share the SnoaL fold.	2.62978e-24
NC_020561.1\|WP_015456900.1\|159486_160734_+\|MFS-transporter	gnl\|CDD\|340929	cd17371, MFS_MucK, Cis,cis-muconate transport protein and similar proteins of the Major Facilitator Superfamily. This subfamily is composed of Acinetobacter sp. Cis,cis-muconate transport protein (MucK), Escherichia coli putative sialic acid transporter 1, and similar proteins. MucK functions in the uptake of muconate and allows Acinetobacter calcoaceticus ADP1 (BD413) to grow on exogenous cis,cis-muconate as the sole carbon source. The MucK subfamily belongs to the Metazoan Synaptic Vesicle Glycoprotein 2 (SV2) and related small molecule transporter family (SV2-like) of the Major Facilitator Superfamily (MFS) of membrane transport proteins. MFS proteins are thought to function through a single substrate binding site, alternating-access mechanism involving a rocker-switch type of movement.	7.43688e-32
NC_020561.1\|WP_015456898.1\|157497_157971_-\|Lrp/AsnC-family-transcriptional-regulator	gnl\|CDD\|224439	COG1522, Lrp, Transcriptional regulators [Transcription].	6.11267e-18
NC_020561.1\|WP_015456892.1\|150459_151431_-\|alpha/beta-hydrolase	gnl\|CDD\|369561	pfam07859, Abhydrolase_3, alpha/beta hydrolase fold. This catalytic domain is found in a very wide range of enzymes.	2.69045e-63
NC_020561.1\|WP_015456895.1\|153476_154952_-\|ATP-grasp-domain-containing-protein	gnl\|CDD\|227111	COG4770, COG4770, Acetyl/propionyl-CoA carboxylase, alpha subunit [Lipid metabolism].	0
NC_020561.1\|WP_051128686.1\|155062_156274_+\|acyl-CoA-dehydrogenase-family-protein	gnl\|CDD\|173845	cd01156, IVD, Isovaleryl-CoA dehydrogenase. Isovaleryl-CoA dehydrogenase (IVD) is an is an acyl-CoA dehydrogenase, which catalyzes the third step in leucine catabolism, the conversion of isovaleryl-CoA (3-methylbutyryl-CoA) into 3-methylcrotonyl-CoA. IVD is a homotetramer and has the greatest affinity for small branched chain substrates.	8.52364e-156
NC_020561.1\|WP_041865032.1\|151447_153055_-\|methylcrotonoyl-CoA-carboxylase	gnl\|CDD\|178415	PLN02820, PLN02820, 3-methylcrotonyl-CoA carboxylase, beta chain.	0
NC_020561.1\|WP_107394544.1\|164199_164994_+\|PEPxxWA-CTERM-sorting-domain-containing-protein	gnl\|CDD\|377877	pfam07589, VPEP, PEP-CTERM motif. This motif has been identified in a wide range of bacteria at their C-terminus. It has been suggested that this is a protein sorting signal. Based on phylogenetic profiling it has been suggested that the EpsH family of proteins mediate this function.	0.000147548
NC_020561.1\|WP_015456907.1\|166102_166819_+\|cytochrome-c-biogenesis-protein-CcsA	gnl\|CDD\|273492	TIGR01191, Heme_exporter_protein_C, heme exporter protein CcmC. This model describes the cyt c biogenesis protein encoded by ccmC in bacteria. It must be noted an arabidopsis, a tritcum and a piscum plant proteins were recognizable in the clade. Quite likely they are of organellar origin. Bacterial c-type cytocromes are located on the periplasmic side of the cytoplasmic membrane. Several gene products encoded in a locus designated as 'ccm' are implicated in the transport and assembly of the functional cytochrome C. This cluster includes genes, ccmA;B;C;D;E;F;G and H. The posttranslational pathway includes the transport of heme moiety, the secretion of the apoprotein and the covalent attachment of the heme with the apoprotein. The proteins ccmA and B represent an ABC transporter; ccmC and D participate in the heme transfer to ccmE, which function as a periplasmic heme chaperone. The presence of ccmF, G and H is suggested to be obligatory for the final functional assembly of cytochrome c. [Protein fate, Protein and peptide secretion and trafficking, Transport and binding proteins, Other].	2.6057e-68
NC_020561.1\|WP_015456899.1\|158566_159439_+\|helix-turn-helix-transcriptional-regulator	gnl\|CDD\|225117	COG2207, AraC, AraC-type DNA-binding domain-containing proteins [Transcription].	5.47053e-19
NC_020561.1\|WP_015456904.1\|162892_163942_+\|Glu/Leu/Phe/Val-dehydrogenase	gnl\|CDD\|223411	COG0334, GdhA, Glutamate dehydrogenase/leucine dehydrogenase [Amino acid transport and metabolism].	5.61845e-80
NC_020561.1\|WP_015456903.1\|162182_162596_-\|Rrf2-family-transcriptional-regulator	gnl\|CDD\|224870	COG1959, COG1959, Predicted transcriptional regulator [Transcription].	8.31922e-44
NC_020561.1\|WP_015456901.1\|160730_161477_+\|SDR-family-oxidoreductase	gnl\|CDD\|235546	PRK05653, fabG, 3-oxoacyl-ACP reductase FabG.	7.08049e-79

>NC_020561.1|WP_015456897.1|156273_157122_+|SDR-family-oxidoreductase
MTEVYGRSDEELATIPIALAPGLFAGKVVVVSGAGSGIGRAVAHWFARLGAKLVLCGRKAEKLEATAAGLSRYAAETLVHPLSIRDPEAVAAMFDAAWAHFGRVDILVNNAGGQFPQAAIDFSPKGWAAVIDTNLNGTWYMMQAAARKWRDAGLPGSIVNVATVIWRGMPGVAHTCAARAGVIYGSKTVAIEWAPLNIRVNCVSPGIIATEGMAVYSDEARAEMPNTNLMRRFGQVEDIANAVCYLAGDAGGFITGEVLTIDGGNQLWGDQWTIPKPDFFRV
>NC_020561.1|WP_051128686.1|155062_156274_+|acyl-CoA-dehydrogenase-family-protein
MKEGRRELDLGTNIFPGGFALTSEQQEILDTASAFARDRFAPLQQRMDDEEWWPPEAMPELGRMGFLGVTAPARFGGADSDFFTSGLIAQGLARWNHSIALSYVAHENLCLNNIARNASEEVKARYLPGLCDGSAIGALGLTEPGAGSDALGSMATTARREGGKYLLNGRKLYITNGPVADVILVYARTDKEAGTKGISAFIVEKGFKGFKVAQKLDKMGFRGSTTAELVFDDCEVPAENLVGVENRGVGIVMSGLDLERAVVAMLNVGMAERALDLAIDYARTRTQFGRPIGEFQLVQGKLAEMYVGVETMKALCYRTLAECNAIGEDGGGRGEIHKLTAAAILHAAETCTRVISDSVQIHGGVGYMREAEINRLYRASKLLEIGAGTSEIRKLIIAGELLR
>NC_020561.1|WP_015456895.1|153476_154952_-|ATP-grasp-domain-containing-protein
MTAFPFESVLIANRGEIAARLARTVKALGLRALLVAHRVDEGSPALALADDVRWIEGPTPVAAFLDIPQIIAAARDMGAGAIHPGYGFLSENAGFARAVAAAGMIFVGPEPDTIELMGDKVRARAFVERHGFPVAPSAIEDDDPATFVERARALGAPILIKPSAGGGGKGMRIVRDMAVLEQEIARGRSEGERYFGDGRLFVERYIERPRHIEVQVLGDAHGNVVHLFERECSLQRRFQKIVEEAPSPALTPQERERICETAAGIARAAGYRNAGTVEFIYGQGEFYFLEMNTRLQVEHPVTEAITGIDLVEQQLRIAAGQPLAFDQTAVTRSGHAIELRICAEDSARDFAPTTGPVLRLAAPAGARFDGGVSEGGRISAAFDPMIGKLIVHGEDRAEAIARADRALAGLVLLGLKTNIGYLRRLMGDPAVIAGDIHTGLIGERTELAAEPVADEATLARLVAIAARHVPELVREAAEIPAMHAAIGGWRN
>NC_020561.1|WP_015456894.1|153054_153477_-|acetyl-CoA-carboxylase-biotin-carboxyl-carrier-protein-subunit
MPGFFLIDGVAHPAALAPADLKAPPPEEAIVARDGDHIWVHVDGAAHELVWQDPITHFEEESASGGDDVARAPMPGSVIQVAVTDGDSVAEGEIMMVIESMKLETAIKAPRDGVVMTVHRAIGQTFERDAALITLEAIAL
>NC_020561.1|WP_041865032.1|151447_153055_-|methylcrotonoyl-CoA-carboxylase
MRRIHSRIDTSGTTYQANRAHNLRMVAELREKQEAVRNVRPQRDRDRLDRQGKMFLRDRLEALLDPGTPFLELSTLAANMAYDGDVPGAGQLSGIGVVSGREVVIHADDASVKGGAWYPLSVKKIVRTLDIAIENRLPVVHLCDSAGGFLPLQAEFFADRYHAGRIFRNQSILSKMGVPQVAVVMGHCTAGGAYIPALSDYNVIVRGTGAIFLGGPPLVKAATGEEVTVEELGGADMHTSVSGTADYPASSERHAIAIAREIVGRFTRAEKAQVDWAEPEPPYYDPQELYGILPQDSRTTFDMREVIARIVDGSRFHEYQPRYGETLVCGFARIWGYQVGILANNGVLFNDSSLKGAHFIQLCDKNRTPLIFLQNITGFMVGREYERRGISKDGAKMIMAVSGASVPKFTVNCNGAFGAGVYGMSGRAFDSRFLFSWPQGQTSVMGAEQAANVLTDIKLRQLARNGDTLTAEQIDAIRDPVIEGYKREQSAYYATSEIWDDGLLDPVDTRNALGIAISAALNAPIEDPHYGVFRL
>NC_020561.1|WP_015456892.1|150459_151431_-|alpha/beta-hydrolase
MTVETHSASLHLVDPELRAALDAFPTFDLNEDLLPVMRAQGFGVDVPPPQGPAAGVAVERITVPGRDGEPDVSCLLYTPPGRTGQSGAYLHIHGGGYVLGDAAMSELSNRSLAAAIGCILLSVDYRLAPETRWPGAVEDCYAALGWLHANANRLGVDHQRIAIGGESAGGGHAASLALVARDRGEYRIRHQHLIYPMIDDRTGSTVPALPYAGDFVWTAASNAFGWSALLGHPAGTGEPPRNAVPARVEDLSGLPPTFLGTAALDLFVGENLDYGRRLIAAGVPTELVVAPGAYHGFNGFAPDAAVSRGFNSASLEALRRAIG
>NC_020561.1|WP_015456891.1|149339_150341_-|NADP-dependent-oxidoreductase
MGDLMQAMVLDEFGGPEVLHIATIERPRAAPGNVVVEVAYAGVNPADWKAREGWLSRYFQYQFPFVVGFDAAGIVAEVGEGVTGLKVGDRVVTASNQGIGERGSYAQFVASIEERCVKLPDHVALVDAAAMPTAAITAWEAVFDVGGTEAGSIVLVNGGAGGTGSYAIQLARMAGARVAATCGPANMDYVRGLGAELAIDYRQGDVADAVRAWAPEGVDLVVDTVGQGSLLEAVEFTRKGGVIAPIATLIADEPTIDPARAEARGVRVVPTISSHANQPRQLAALVAALAEGSIHAPEITLMPLDQAGEAHRKIQAGHVRGKIVLVVNEALGR
>NC_020561.1|WP_015456890.1|148839_149304_-|nuclear-transport-factor-2-family-protein
MSLQYLIDKDAIEQVYVRYCEIVDAKTFDDMHEVFTEDATGDYTQALGPGVISPDRASLIASMHANLGPDSNCGATHHNVGNFRVRVDGDHAHAKVHYYAEHLGQGDYAGEQYSMWGQYEDDLVRTVDGWRVKARVYTCAISRGPAAVTSARVG
>NC_020561.1|WP_015456889.1|146905_148723_-|DUF885-family-protein
MDRRSFLVSSGALVLGAALPAPLFAKTDADGALNALLDSFFYESLEDSPEAATSQGLDKGQRAALKSKLSDYSTSGRAKRLVRAKDQAARLARVDRAALSSLGHVNYDVTEYMLAQDIKGLGKYPFGSVDGIWSPYAISQLGGAYQGVPDFLDSQHGIENKADADAYLARLDAFATVLDQDSERQRAEAAYGAVAPDFSLDLTIAQLEALRGKPAAETVLVQSIARRTKEKGIAGDWAAQAAKIVSGKIFPALDRQIALVKQLRATASSDAGVWRLPEGAAFYADALANSTTTTLSPEEIHQIGLEQVAELTARIDTILKAEGMTQGTVGERLTALNADPKQLYPNTDEGRAALLASLNADIHKMTALLPRAFSTLPKAPIEVRRVPVFIQDGAPNGYYNPAALDGSRDAIYYINLKDTHDWPKYGLPALTFHEAVPGHHLQGSLAQETQGIPILRRQTFFSAYGEGWALYAEGVAEELGAYGDDRLGIAGSLQSLLFRAVRLVIDTGIHAKRWTREQATDYMVANTGFPRPRSLREVERYCVWPGQACSYKVGHNKWVELRKRAEAELGDRFDLAWFHDVLLDGAMPLTILEARVNERIAARKA
>NC_020561.1|WP_187294044.1|144733_146833_-|PBP1A-family-penicillin-binding-protein
MRDDDPYDLEWTEPEEDRRAPASPRTTDRKPPQRGAAAPRAFWKRWRFWKRVAQAGALIFVLLVGWLAITAPLSRSLKPIAPPSITLLSSDGKPIARKGAIIDRPVVVADLPPHVPQAFMAIEDRRFYSHWGIDPRGIARAAWRNTVAGGVREGGSTITQQLAKVAFLDSDRTAARKLREVLIAFWLEARLSKDEILSRYLSNVYFGDNVYGLRAAALHYFNRQPEKLNVAQAAMLAGLLKAPSRLSPAVNLKGARERQRVVVAAMADAGFLTPAEAAGVPPASLNLRPLKMLPSGTYFADWALPAARDNAGAVYAEQEVKTTLDSRIQRAAEAAVRRAGLGKAQVALVAMRPDGSVVAMIGGKNYADSPFNRATQARRQPGSTFKLFVYLAAIRHGLTPDSLVEDEPITIAGWSPKNNDGRYRGKITLREAFARSSNVAAVRIASEVGMDNVIRAARDLGITSPLAADDATLALGTSGVTLLELTSAYAAIAANAYPVKAHALPDKERSWYDAFWDRPRAFDGETRAMLLDLLGAAVREGTGRSATLAIDAFGKTGTSQDNRDAIFVGFSGDLVAAVWVGNDDNSPLGGIAGGGLPARIWRDFMSRVVDGAAPPVVEREPAPAAEPDPIGDLIENQVDNLSIAVNGAIGDVDVGLRVGPDGLTISANPGNNRPPEERRGPGPAIAPPPPVPEPVPNGQ
>NC_020561.1|WP_015456898.1|157497_157971_-|Lrp/AsnC-family-transcriptional-regulator
MVKKAGAPFDIDGLDEKIIAALRCNGRIATRDLATEVGVKEATVRAHLRRLEDNDIVRVVAMRDLAALGYNCVSAVGIQVRGRPAADVAAELAEMEQVITVAVAIGIHDLEVQLVARDVHELDQLLTGVIAKVRGVDQIFPSVALKVMKYVSEWAPF
>NC_020561.1|WP_015456899.1|158566_159439_+|helix-turn-helix-transcriptional-regulator
MHEDQAGAIEQHFAVGDFRLDVLSQPDTGPFTRTHLVDYPSIAYLPTGQGEDPVRGCFGEPRSHRSFVPFGAAVLVPANLAVHVQSTGYAERRLLICRFDPDIFESLTGLGANASGDELAACIDVRDAAVLATLERLSIAVSRPSTAREMLVRGLGMVLLAELTRHFELVRERGFHRAGTLAPWQLKRIDQRLADESKPVPSVSELASLCGIGRRHLMRAFKATRGSTVMEHVERTLFARAARMLGETTIPVKSLAVSLGYERQGSFSAAFRRRFGETPRDYRARASAGR
>NC_020561.1|WP_015456900.1|159486_160734_+|MFS-transporter
MKPHRAEGTPQRLRAADIGLIAMLAFVVMFEGFDISLTSVVLPFVGKAYGVDAEGLGRSLSVIGLGAIAAWFVIRLSDRFGRRPVLLLSAGAFSIGSLATILMPTIESYTLVQALTRIALVSQIATAYLIVSESLPPALRGRAAGLLGACGSFGAALPAALLATALDTSLSWRGLFLVGGAPLLILPLLWFRLGETPAFTARKAAPSNALEELRMLVAPGLRRRFVAMSLLWLIVNFSAVVSTFFFTFYVLNERGWTAADLALIAPFGLGSAFFGYLAAGFLMDGIGRRATAALFFVANGLLVMICYAATGWLAIAACYVGIQAMLGTWTICFTLNAELFPTHVRAAANGWCHNLIGRWGMVGTPLLIGWLSRLWGSVGTTCFWLGLSCFAALPVILFALPETRGRNLSTEESDA
>NC_020561.1|WP_015456901.1|160730_161477_+|SDR-family-oxidoreductase
MNRMVGKVALVTGAASGIGRASAVRLASEGAIVICADRNMAGAEETASGLSGASAVQFDAASAASCRDLVAHVVARHGKLDVLCNIAGIGGFGHAAEISDESWDQLVAINLSSIFHLTKAALPHLEKTQGNIVNMASASGLVGAAYASAYSATKAGVVGYTRTVAIEYAARQVRVNAICPGGVDTPLIAGGMGDIEGVDFALILRMSPKMAPLAQPEDVAAAVAFLASDDARFITGIMLPVDGGQTAG
>NC_020561.1|WP_015456902.1|161461_162049_-|EthD-domain-containing-protein
MMKSIGFLPRLAGIARPDFRNYYETRHAPLADSYFHFAGYVRNHIVDGQEPGFDCISEFWTADPAAIATLLAGEAGERMRADERNFADSPNIRPALAEPAPTGRLVPLGPRTVQFLGGHDNARLIAAVAASAGAEALTLDFLTPFDAASRAPCDALLIREGTAAAAPSLPSGWTLLASLQVVAEGALPISHQPAV
>NC_020561.1|WP_015456903.1|162182_162596_-|Rrf2-family-transcriptional-regulator
MLSQRTRYAIRALLHLGDRYGEGPVQLPEIAEAQNIPAKFLTVILSEMKRAGLVETLRGKEGGYWLARPPEEITYGEIVRLTRGSLALVPCAARLAYHPCENCVDEATCRLRAVMLSVRDETANILDRVSLSEKMAV
>NC_020561.1|WP_015456904.1|162892_163942_+|Glu/Leu/Phe/Val-dehydrogenase
MTAPWDFPDYDDHEGVHLFRDQASGLTAIIAIHSTALGPAAGGTRFWHYPNRADAITDALRLSRGMSYKNAMAGLPMGGGKGVILADRNRTKTPEMLAAFGRAVESLGGRYVTAEDVGITDADMVEVRKQTTHVAGLPVGSDAAGGDPGPFTSLGVFLGVKAAIRRALKRDDVAGVHVAIQGVGSVGGGLARRLAAEGARLTLADVDAARAERLAEELGAKTVAAGDIARVEADVFSPCALGAILDEASIPLLSVPVVAGGANNQLATKEDGARLHARGVLYAPDYVINGGGIINVGLEYLGGADRAEVERRIGHIPGRLEQIWQESAETGDPSAEVADRIARRLIGRH
>NC_020561.1|WP_107394544.1|164199_164994_+|PEPxxWA-CTERM-sorting-domain-containing-protein
MFVGGAAYADTTVVPASSLTSSGNYYTDNIGDIVVMTGGGNAPGIGNPSGRNDDGFSGPIDLGFNFTLYGNTYSSLYINNNGNVSFGAGISAYVPTGPTGANAPLVSVFFGDVDTRGANSGVVHYQLDTPGQLIVTWDNVGRYNGRSDLLNSFQLVLRSDDFVIPTNEGQIGFFYKNMGWDQTDTSQVAAIGFGDGAGNATILEGSLSSGLNRVVQNKYIWFNANLEPVPSGVPEPTTWAMMLIGFGVVGVSMRRRQRVRVAFA
>NC_020561.1|WP_187294045.1|165051_165933_-|DMT-family-transporter
MRGILLRIGSVVMFGIMQAAMKLAGEHGVIAIEMVFYRSIFGLPIVLAWLAIGPGFATIRPNRPRAHVWRSIIGLSGITLNFTALILLPLADATTIGFTAPIFATILSALLLHEHVGRHRWLAVAIGFLGVVVITRPGAASGLPAIGILVALGGAVGTSAVTVTLRQLGSTETVGAIVFWFFVGCAIVGGIGTAIWGSGHDAATFGLLTIGAWAGAAAQLLMTASLRAAPVSTVAPFDYLQIIIAISLGWLIWATGPSLATLAGAAMIAGSGLYTAYREHRLRRDSVAATPPV
>NC_020561.1|WP_015456907.1|166102_166819_+|cytochrome-c-biogenesis-protein-CcsA
MHIFANPNRFLGIARPLTPWLGWGGAVLTAIALLSGLFLTPPEQLQGESVRIMYVHVPSAWLGMGGWTGIAVASLMQLVWRHPLAAVAARAVALPGALFTAICLVTGSIWGRPTWGTWWEWDGRLTSMLVLLFLYIAYIALAGATADRAGGSRVAAIFGLVGAINIPIIKYSVDWWNTLHQTASITLTKNTIDPSILWPLPIALIGFSMLFGAIVLMRMRALLAEARIEARLKRMADA

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_020561_2

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_020561_2

1587617-1587795

Orphan

Consensus_repeat	Method
TGGAGGCCGGAGCCGGGGTGGGCGCAGGCGCGGCGGCGGGCGCCTCGGCCACGG	PILER-CR

2 spacers

The CRISPR arrays of NC_020561_2

>merge|NC_020561|2|1587617-1587795|PILER-CR
GGCCGGGCGCGGCGTCGGCGCAGGCGCGGCGGCGCGCGGCGCGGCCGGCTTCGGGGCAGGCGCTGGCTTGGCGGCCGGCGCGGGGGTGGGCGCAGGCGCGGGCGCCTCCGCCACCGGGGCCGGCGTGGAGGCGGGAGCCGGGGTGGGCGCGGGCGCGGCGGCGGGAGCCTCGGCCACGG

>NC_020561|2|1|1587617-1587795|PILER-CR
GGCCGGGCGCGGCGTCGGCGCAGGCGCGGCGGCGCGCGGCGCGGCCGGCTTCGGGGC	AGGCGCTGGCTTGGCGGCCG
GCGCGGGGGTGGGCGCAGGCGCGGGCGCCTCCGCCACCGGGGCCGGCGTGGAGGCGG	GAGCCG
GGGTGGGCGCGGGCGCGGCGGCGGGAGCCTCGGCCACGG

Protein	Signature genes	Signature genes Name	Protein_function
NC_020561.1\|WP_015458265.1\|1588844_1590452_-\|transcription-termination/antitermination-protein-NusA	unknown	unknown	gnl\|CDD\|236410
NC_020561.1\|WP_015458254.1\|1577703_1578123_+\|large-conductance-mechanosensitive-channel-protein-MscL	unknown	unknown	gnl\|CDD\|237569
NC_020561.1\|WP_015458272.1\|1595706_1597665_-\|TonB-dependent-receptor	unknown	unknown	gnl\|CDD\|226664
NC_020561.1\|WP_015458271.1\|1595284_1595692_-\|DUF1636-domain-containing-protein	unknown	unknown	gnl\|CDD\|377928
NC_020561.1\|WP_015458273.1\|1598012_1598789_-\|ABC-transporter-ATP-binding-protein	unknown	unknown	gnl\|CDD\|224045
NC_020561.1\|WP_015458256.1\|1579186_1581511_-\|polyribonucleotide-nucleotidyltransferase	unknown	unknown	gnl\|CDD\|236995
NC_020561.1\|WP_015458253.1\|1576968_1577604_-\|NUDIX-hydrolase	unknown	unknown	gnl\|CDD\|239516
NC_020561.1\|WP_015458260.1\|1583408_1583969_-\|GNAT-family-N-acetyltransferase	unknown	unknown	gnl\|CDD\|224584
NC_020561.1\|WP_015458259.1\|1582937_1583375_-\|hypothetical-protein	unknown	unknown	unknown
NC_020561.1\|WP_015458257.1\|1581708_1581978_-\|30S-ribosomal-protein-S15	unknown	unknown	gnl\|CDD\|180170
NC_020561.1\|WP_015458255.1\|1578826_1579099_+\|hypothetical-protein	unknown	unknown	unknown
NC_020561.1\|WP_015458266.1\|1590461_1590992_-\|ribosome-maturation-protein-RimP	unknown	unknown	gnl\|CDD\|237773
NC_020561.1\|WP_015458262.1\|1584827_1585259_-\|30S-ribosome-binding-factor-RbfA	unknown	unknown	gnl\|CDD\|234787
NC_020561.1\|WP_015458270.1\|1594644_1595214_+\|TMEM165/GDT1-family-protein	unknown	unknown	gnl\|CDD\|225030
NC_020561.1\|WP_015458264.1\|1588054_1588858_-\|DUF448-domain-containing-protein	unknown	unknown	gnl\|CDD\|236401
NC_020561.1\|WP_015458258.1\|1581983_1582880_-\|tRNA-pseudouridine(55)-synthase-TruB	unknown	unknown	gnl\|CDD\|235442
NC_020561.1\|WP_015458261.1\|1583961_1584543_-\|thymidine-kinase	unknown	unknown	gnl\|CDD\|235272
NC_020561.1\|WP_015458267.1\|1591198_1592431_+\|class-I-SAM-dependent-methyltransferase	unknown	unknown	gnl\|CDD\|225139
NC_020561.1\|WP_015458269.1\|1593696_1594356_-\|hypothetical-protein	unknown	unknown	unknown
NC_020561.1\|WP_015458268.1\|1592523_1593672_+\|PQQ-dependent-sugar-dehydrogenase	unknown	unknown	gnl\|CDD\|369642

Protein	Function_ID	Function_description	E-value
NC_020561.1\|WP_015458265.1\|1588844_1590452_-\|transcription-termination/antitermination-protein-NusA	gnl\|CDD\|236410	PRK09202, nusA, transcription elongation factor NusA; Validated.	0
NC_020561.1\|WP_015458254.1\|1577703_1578123_+\|large-conductance-mechanosensitive-channel-protein-MscL	gnl\|CDD\|237569	PRK13952, mscL, large conductance mechanosensitive channel protein MscL.	1.81966e-64
NC_020561.1\|WP_015458272.1\|1595706_1597665_-\|TonB-dependent-receptor	gnl\|CDD\|226664	COG4206, BtuB, Outer membrane cobalamin receptor protein [Coenzyme metabolism].	3.29651e-141
NC_020561.1\|WP_015458273.1\|1598012_1598789_-\|ABC-transporter-ATP-binding-protein	gnl\|CDD\|224045	COG1120, FepC, ABC-type cobalamin/Fe3+-siderophores transport systems, ATPase components [Inorganic ion transport and metabolism / Coenzyme metabolism].	1.28677e-89
NC_020561.1\|WP_015458256.1\|1579186_1581511_-\|polyribonucleotide-nucleotidyltransferase	gnl\|CDD\|236995	PRK11824, PRK11824, polynucleotide phosphorylase/polyadenylase; Provisional.	0
NC_020561.1\|WP_015458253.1\|1576968_1577604_-\|NUDIX-hydrolase	gnl\|CDD\|239516	cd03424, ADPRase_NUDT5, ADP-ribose pyrophosphatase (ADPRase) catalyzes the hydrolysis of ADP-ribose and a variety of additional ADP-sugar conjugates to AMP and ribose-5-phosphate. Like other members of the Nudix hydrolase superfamily, it requires a divalent cation, such as Mg2+, for its activity. It also contains a highly conserved 23-residue Nudix motif (GX5EX7REUXEEXGU, where U = I, L or V) which functions as a metal binding site/catalytic site. In addition to the Nudix motif, there are additional conserved amino acid residues, distal from the signature sequence, that correlate with substrate specificity. In humans, there are four distinct ADPRase activities, three putative cytosolic enzymes (ADPRase-I, -II, and -Mn) and a single mitochondrial enzyme (ADPRase-m). Human ADPRase-II is also referred to as NUDT5. It lacks the N-terminal target sequence unique to mitochondrial ADPRase. The different cytosolic types are distinguished by their specificities for substrate and specific requirement for metal ions. NUDT5 forms a homodimer.	1.70159e-41
NC_020561.1\|WP_015458260.1\|1583408_1583969_-\|GNAT-family-N-acetyltransferase	gnl\|CDD\|224584	COG1670, RimL, Acetyltransferases, including N-acetylases of ribosomal proteins [Translation, ribosomal structure and biogenesis].	4.13539e-18
NC_020561.1\|WP_015458257.1\|1581708_1581978_-\|30S-ribosomal-protein-S15	gnl\|CDD\|180170	PRK05626, rpsO, 30S ribosomal protein S15; Reviewed.	2.17586e-52
NC_020561.1\|WP_015458267.1\|1591198_1592431_+\|class-I-SAM-dependent-methyltransferase	gnl\|CDD\|225139	COG2230, Cfa, Cyclopropane fatty acid synthase and related methyltransferases [Cell envelope biogenesis, outer membrane].	4.39064e-120
NC_020561.1\|WP_015458266.1\|1590461_1590992_-\|ribosome-maturation-protein-RimP	gnl\|CDD\|237773	PRK14636, PRK14636, ribosome maturation protein RimP.	2.13773e-89
NC_020561.1\|WP_015458262.1\|1584827_1585259_-\|30S-ribosome-binding-factor-RbfA	gnl\|CDD\|234787	PRK00521, rbfA, 30S ribosome-binding factor RbfA.	1.56524e-39
NC_020561.1\|WP_015458271.1\|1595284_1595692_-\|DUF1636-domain-containing-protein	gnl\|CDD\|377928	pfam07845, DUF1636, Protein of unknown function (DUF1636). The sequences featured in this family are derived from a number of hypothetical prokaryotic proteins. The region in question is approximately 130 amino acids long.	4.77746e-45
NC_020561.1\|WP_015458264.1\|1588054_1588858_-\|DUF448-domain-containing-protein	gnl\|CDD\|236401	PRK09190, PRK09190, RNA-binding protein.	5.88045e-47
NC_020561.1\|WP_015458258.1\|1581983_1582880_-\|tRNA-pseudouridine(55)-synthase-TruB	gnl\|CDD\|235442	PRK05389, truB, tRNA pseudouridine synthase B; Provisional.	9.116e-117
NC_020561.1\|WP_015458261.1\|1583961_1584543_-\|thymidine-kinase	gnl\|CDD\|235272	PRK04296, PRK04296, thymidine kinase; Provisional.	8.05663e-105
NC_020561.1\|WP_015458270.1\|1594644_1595214_+\|TMEM165/GDT1-family-protein	gnl\|CDD\|225030	COG2119, COG2119, Predicted membrane protein [Function unknown].	2.06909e-53
NC_020561.1\|WP_015458268.1\|1592523_1593672_+\|PQQ-dependent-sugar-dehydrogenase	gnl\|CDD\|369642	pfam07995, GSDH, Glucose / Sorbosone dehydrogenase. Members of this family are glucose/sorbosone dehydrogenases that possess a beta-propeller fold.	2.97396e-169

>NC_020561.1|WP_015458262.1|1584827_1585259_-|30S-ribosome-binding-factor-RbfA
MRRNETPEGKSVRVLRVGEQVRHALADILMRGDVHDDVLASHTVSVTEVRMSPDLRHATAFVKPLLGADEEKVLKALRTNTAYLQSEVARRVNTKYAAKLKFLADESFDEGSHIDALLRRPEIARDLDPDDAGGDGGEADRDG
>NC_020561.1|WP_015458261.1|1583961_1584543_-|thymidine-kinase
MAKLYFYYASMNAGKSATLLQADFNYRERGMETMLFTAAIDDRYAPGRISSRIGLEAEAFPFDVATDLRGEVESELARRPLACVLVDEAQFLTRDQVFQLASICDDLGIPVLAYGLRTDFRAELFEGSAHLLALADALVEIKAICECGVKATMNLRTDAMGRAVREGAQTEIGGNDRYVALCRRHFMERMRNG
>NC_020561.1|WP_015458260.1|1583408_1583969_-|GNAT-family-N-acetyltransferase
MADAARLLVPLVEGDARLVPLEERHREALRAACAADADIWTIYNVSYDPDHFDASFDALMANPARLGFAILQDDAVIGMTAYLGVDAGKGLLEIGNSYIAPAARGTGLNGRIKRLMIDHAIACGFRRIEFRIDARNGRSMAAVEKLGGVKEGVLRQERITWNGHLRDTVLYSILADEWRARFTAGS
>NC_020561.1|WP_015458259.1|1582937_1583375_-|hypothetical-protein
MTRHPCTVALLALMLASPAMAGQAPDPEAAPAAREAAIPFLGSESINDYRVEGRDTLYIQDIRGRWYKAELMGNCLDLDLAEVIGFDTGGTSSFDRFSTIVVRGRRCPLKSLVASPAPPPARGKTHAHHHGGKAPQSDPPEDDQG
>NC_020561.1|WP_015458258.1|1581983_1582880_-|tRNA-pseudouridine(55)-synthase-TruB
MDGWIIIDKPVGIGSTQVVSAVKRVLRQGGYGKHKVGHGGTLDPLASGVLPIAVGEATKLSGRMLDADKAYDFTIGFGTETDTLDAEGKAIATSDVRPPRAAVEAVLPRFTGAIDQVPPAFSALKVDGARAYDLARAGEEVVLKSRAVTIHDLRLSAWDGAGATLSARVSKGTYIRSLARDIAYALDTVGHVTMLRRTKAGPFTLDQAISLDKLEESAKGHALEDILLPLTAGLDDIPALAVSPDQARALREGRKLIGIAKHQGLHLAVSGQVPVALVEVSGPEIRVVRGFNIRDVEG
>NC_020561.1|WP_015458257.1|1581708_1581978_-|30S-ribosomal-protein-S15
MTITAARKAELIATHARGEGDTGSPEVQVAILSERIANLTEHFKTHAKDNHSRRGLLMLVNKRRSLLDYLKREDAGRYADIVAKLGLRK
>NC_020561.1|WP_015458256.1|1579186_1581511_-|polyribonucleotide-nucleotidyltransferase
MFNIKKQEIQWGGQTLTLETGRVARQADGAVVATLGETVVLCAVTAARSVKEGQDFFPLTVHYQEKYFSSGRIPGGFFKRERGATEKETLVSRLIDRPVRPLFPEGFYNEINVIAQVLSYDGENEPDILAMIAASAALTLSGVPFMGPIGAARVGYKDGEYILNPTDAQVAEGDLDLVVAGTHDAVMMVESEAKELSEDVMLGAVMFGHREMQKVIDAIIDLAEAAAKDPWELAAQPDTSAMKAKLKKLVGKDIAAAYKLINKSDRSNALNAARAKAKEAFADASPQDQMVASKLVKKLEAEIVRTAILKDGRRIDGRDTKTVRPIVAEAHFLPRAHGSALFTRGETQSISTCTLGTKDAEQMIDGLNGLRYEHFMLHYNFPPYSVGEVGRFGAPGRREVGHGKLAWRALHGVLPTKEEFPYTIRLTSDITESNGSSSMATVCGGSLALMDAGVPIKRPVSGIAMGLILEGKDFAVLSDILGDEDHLGDMDFKVAGTSEGITSLQMDIKIAGITEEIMKVALHQASDGRAHILGEMAKALDHTRTELSAHAPRIETMTVPKEKIRDVIGTGGKVIREIVAQTGAKVDIEDDGTVKISSSDLDKIEAAKNWIIGIVAEPEVGKVYTGKVVNLVDFGAFVNFMGGRDGLVHVSEIKNERVAKVSDVLSEGQEVKVKVLEVDQRGKVRLSMRVVDQETGAELEDTRPAREPREGGDRGPRGDRGDRGDRGDRGDRRREGGDRGPRRDRGDRGPRRERDNDDGPAPEFAPAFLKRDDD
>NC_020561.1|WP_015458255.1|1578826_1579099_+|hypothetical-protein
MNRMIKLTAIAAFAALAACGGKGDDSLAANVEQAYDNQADQLDAIADNTTNDAQADAIEDQADTLRQEGDNRADAIDAADVNAAATHNGL
>NC_020561.1|WP_015458254.1|1577703_1578123_+|large-conductance-mechanosensitive-channel-protein-MscL
MLKEFKAFINRGNVLDLAVAVIIGAAFSKIVSSLTDDIIMPVVGKLFGGLDFSGYFIRLGEIPANFAGSANSYADLKKAGVPLLGYGEFITVAVNFLIVAFIIFLIVRAVNRAIPLEGPADTPDVAVLKEIRDELKKRP
>NC_020561.1|WP_015458253.1|1576968_1577604_-|NUDIX-hydrolase
MNHDPVQKHSAAGHPLPDDADQPAEILWQGRFIEARRKGKWEYVGRARGIGAAVILAVDDGHVLLVEQYRVPLGAPCLELPAGLVGDDVAGEPIETAAGRELEEETGYRAGRLENAGCFAASPGMVSETFTLIVARDLVRVGPGGGVEGENIVVHRVPLDEVADFVAERRRAGVMMDVKLLLLLGAGLIGSTLPDGRQAPATPLAPMLRGH
>NC_020561.1|WP_015458264.1|1588054_1588858_-|DUF448-domain-containing-protein
MASNEHPSAIAPTHRPSRAKPKGGPRAGGKHAESAPDAGGEDVVDTGHGPERRCVLSGDHGPRDGLIRLALGPDGTVAPDVRAKAGGRGAWIAVDRVALETAIAKGKLKGALARAFKTASFLIPDDLPAQIERALERAALDRLGLEARAGNLVTGSERIVDAARKGTVALLLHARDAAADGTRKLDQALRVGLDMEGTDTRGLVIPASRAILSMALGRENVVHIALVAPAAAARVSDALGRWRGFIGRNGSAEPCDTPSQGPSALRN
>NC_020561.1|WP_015458265.1|1588844_1590452_-|transcription-termination/antitermination-protein-NusA
MATAISANRAELLAIADAVAREKLIDREIVIEAMEDAIQRAARARYGAENDIRAKIDPRSGDMRLWRVVEVVEQVDDYFKQVSVADAQKLQPGAAVGDFIVDPLPPIEFGRIAAQAAKQVIFQKVRDAERERQYDEFKDRAGEIITGVVKRVEFGHVVVDLGRAEGVIRRDQQIPREVLRVGDRVRSLILSVRRENRGPQIFLSRAHPDFMKKLFAQEVPEIYDGIIEIKAAARDPGSRAKIGVISHDGSIDPVGACVGMKGSRVQAVVQEMQGEKIDIIPWSPDTATFVVNALQPAQVARVVIDEEEERIEVVVPDDQLSLAIGRRGQNVRLASQLTGKAIDILTEADASEKRQKEFVQNSEMFQNELDVDETLAQLLVAEGFGSLEEVAYVEADEIASIEGFDEELAAELQSRAQEALDRREQANRDERRALGVEDDLADLPYLTEAMLVTLGKAGIKTLDDLADLATDELVQKKRAEPRRRNENAPKRAEDKGGVLAEYNLTEEQGNEIIMAARAHWFADEAQEDAAADGEQ
>NC_020561.1|WP_015458266.1|1590461_1590992_-|ribosome-maturation-protein-RimP
MADADIAALTKLIEPEAQALGLALVRVAMFGGKSDPTLQVMAERPDTRQLDLADCEALSRRISDVLDAADPIEEAYRLEVSSPGIDRPLTRLKDFEDWAGFDARIKVAPPLDGRKQFDARLDGLEGETVKVYAERVGEVAIPFGRIASAKLILTDALLKATAPLSTEGADRISKEG
>NC_020561.1|WP_015458267.1|1591198_1592431_+|class-I-SAM-dependent-methyltransferase
MWLLDRMLSGIVKRGVLHVTYADGTEKAYGTATPGWAEIRIRFTDKGAPNFIARNPRLGAAEAWMDGRLTVEGDDVRGLIDLLRGNAPWEKGGDKLKASFWREQLQSILARLDRINWERRSRRNVAHHYDLNGRLYDLFLDKDRQYSCAYFTDPGNSLEQAQADKKAHIAAKLDLKPGQKVLDIGCGWGGMALYLHRVADVDVLGITLSEEQLAVARRRAQEAGVADRVKFELIDYREVQGQFDRIVSVGMFEHVGPPHYRTFFDKCRTLLAEDGVMLIHTIGRMGKPSTTDAFTAKYIFPGGYIPALSEVVSASERSKLILSDLETLRVHYAWTLDIWYDRTVAARAEIEALYDARFYRMWLFYLAGAAAAFRHGGMCNYQLQYIRRRDALPYTRDYIAEAERELRAKA
>NC_020561.1|WP_015458268.1|1592523_1593672_+|PQQ-dependent-sugar-dehydrogenase
MHRPTSFILPAIALLAACGGAGEEGNAAAPATAAAADKPFVATVVADFDSPWAMTFLPDGRMLVTEKAGRMLLVSADGKAATPLAGIPAVDSEGQGALMDVVLHPKFAENRLVYFSFSEKGEGGKGVALARGTLAEGPAPALRDVQVIFRASPYVEGDGHYSGRIAFAPDGHLFFTNGERQKFDPAQDPKSTLGKVLRLNDDGTPAKGNPLAARGFHPAIWSYGHRNLLGLAFDAQGNLWEQEMGPRHGDELNLILPGRNYGYPIVSNGDHYDGRPIPDHDTRPDLEAPKVYWKPAISPAGLMIYSGDMFPEWKGSAFIGAMNMPGLVRVALDGTSAAKADQWDMDGQRIREVEQGPDGAIWLLEDGLRGSQGRLLRLTPRR
>NC_020561.1|WP_015458269.1|1593696_1594356_-|hypothetical-protein
MRVVIAAPVLMGLALSGCGPKALTLPDDPIDRAATCGVVAALGARAAGGGNVAAALPFDRQAGIMHYALLAGAEGKSFDQSRAAAVAARMPQLEAGISAGKWQDLAPACAAAYPQTQEPAGGPIDLPQDALRAETGCYALGAFLNKTLGGPTSAYKDRLAEFTPMNRALDAKIGAGIAARGLKPDAAVALRSEALATMVKLGPPAGVMASCVARFTPNG
>NC_020561.1|WP_015458270.1|1594644_1595214_+|TMEM165/GDT1-family-protein
MEALLTSTALVALAEIGDKTQLLAIVLATRFKRPWPIVAGILVATLANHFLAALIGSNVAALLDGTWFRYLVAFSFIAMAAWTLIPDKLDDVETKPARFGAFMTTVIAFFLVEMGDKTQIATVALGARFHDVIAVTAGTTLGMMIANVPAVFLGNELVKRVPMRVVHAIAALLFLAIGLWLVAQTAGWL
>NC_020561.1|WP_015458271.1|1595284_1595692_-|DUF1636-domain-containing-protein
MLTRVADGPAVVVCNSCRHSAASREDGEGVRGGARLAEALRAVQATDPDTAHIAIQEMPCLFACSEHCTVHIRAPGRTGYVLGRFAPTGDAARAILDYAVRHAASEEGRVPLREWPEGVKGHFIVRVPPPGFVAD
>NC_020561.1|WP_015458272.1|1595706_1597665_-|TonB-dependent-receptor
MLRSVLLTSFLLSAPAFAEVQVAPVPDAATPPDYDGGAIIVTATRAPIAIDRLASSVTVLDKAAIDRAQDIGVTELLWRTPGVTVSRNGGYGTVTSVRIRGAEAEQTVVVIDGVKLNDPSSTSGGYNFANLLVGDAQRIEVLRGPQSILWGSQAIGGVVNVVTAMPEKDLEASFDVEAGSRDTVNARAGLGGRTGPLAWRIGGNVFTTDGISAIRADQGGGERDGYSNRSLTGRAELEIADGVSADVRGYYSRGRTEIDGFAGDTAEYGINREFVGYAGLNVALLDGRFRNRFAFGYTDTDRDNYDPTRQRQQTFDAAGRNRRFEYQGSFAITDTWTALFGVENERSRFRTVSPAASLAIPVPDPVRGHAGITSLYAQLTGEVLPGLTVNGGVRHDDHKTYGGKTQFAGGAAWSLPTGTVLRASYAEGFKAPTLYQLYSEYGNTTLSPERARGWEAGIEQHLFGDALTLGATWFDRRTKDQIDFYSCPFPAPTDPDEIDPLCLTPAGDARFGYYLNIARTRSRGIEATASLKLSDRLLVDGNYSWIDAENRDTGKWLSRRPRNAANGSISYQWPFGLTTGAAVRWAGKSYDDAGNNRRLDDYTLVDLRAEYDLGGGVRLFGRIENLFDEDYQTVYRYGTLGRSVYGGVRARF
>NC_020561.1|WP_015458273.1|1598012_1598789_-|ABC-transporter-ATP-binding-protein
MVTIRAESLGVALGRRAVLANVDADLAPGRLIGVIGPNGAGKSTLVRALLGLVPLSGGGVRVDGQPVARLPRAALARRIAYLPQGQTLHWPLTVERLVALGRLPHLAPLSRIGEADVAAIDRAIEQADIGHLRGRVATELSGGERARVLLARALAVEAPALIADEPLAALDPGHQLEVMALLRRQADAGALVVAVLHDLSLAAGHCDRLLLLHHGRLVADGPPDRVLTADRLADVYGVRAWIGEVEGRRLVVPISHHG

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_020561_3

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_020561_3

1616584-1618020

orTypeII

Consensus_repeat	Method
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	CRISPRCasFinder
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	CRT
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	PILER-CR
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	PILER-CR

21 spacers

cas2,cas1,cas9

The CRISPR arrays of NC_020561_3

>merge|NC_020561|3|1616584-1618020|CRISPRCasFinder,CRT,PILER-CR,PILER-CR
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGCCGGGCAAGACGGTTGGGCGACGCGCGTTTGAGCCTACCATCGGCAAATCGGTAGGGAAACCACGGCGAAGTTCGCCGGGTCTACGCACGCGCTTTCAGCCTACCATCGGCAAATCGGTAGGGAAACCACGGCCCTATGTCCGTAACAACCCGGACGTGGCCGAGCCTACCATCGGCAAATCGGTAGGGAAACCACGGCAGTGATGACTGACATCGCAACGATAGCGGCAGCCTACCATCGGCAAATCGGTAGGGAAACCACGGCCGAACGTCGCCCTGTAACAACAGCCCTGAAAGCCTACCATCGGCAAATCGGTAGGGAAACCACGGCAGCCCGCTGCAAAGGCGGATTCCGCGACGCAGCCTACCATCGGCAAATCGGTAGGGAAACCACGGCCCGAGTTGCTCGACAGCCAACGCGCTTTAGAGCCTACCATCGGCAAATCGGTAGGGAAACCACGGCGTATCTGTGCGCCAGTCGTACATTGTTGACAGCCTACCATCGGCAAATCGGTAGGGAAACCACGGCCCTTCCACGCGTCAAGCTCACCTTCGAACCAGCCTACCATCGGCAAATCGGTAGGGAAACCACGGCTTTGGCGAAGTCCGCCCACATATGCGCGCAAGCCTACCATCGGCAAATCGGTAGGGAAACCACGGCCGCGGCGAGACCCACGTCAACAACCTGCTGAGCCCACCATCGGCAAATCGGTAGGGAAACCACGGCGCCCATCCCGAGCTCGCGCTTGTAGCGCATAGCCTACCATCGGCAAATCGGTAGGGAAACCACGGCGATTCTTGCCGCGATGGCGGCGGCCCAGGCAGCCTACCATCGGCAAATCGGTAGGGAAACCACGGCACTCGCTGCGAGGGGACGGGGAGAGGAAGGAGCCTACCATCGGCAAATCGGTAGGGAAACCACGGCCCCCCAGGGCGCATAGCCAAGCCGGCCCACAGCCTACCATCGGCAAATCGGTAGGGAAACCACGGCAAGATATCACACAGGCGGTATTGCTGGAGGCGGTATTGCTGGTTAGCCTACCATCGGCAAATCGGTAGGGAAACCACGGCGAAACATTCGATGCGCCAGATCCAGATGATAGCCTACCATCGGCAAATCGGTAGGGAAACCACGGCCTATGTTGACGCGCAGTTCGGTTTGGCCAAAGCCTACCATCGGCAAATCGGTAGGGAAACCACGGCCCAGCGGACGGACGCATATGGGCAAGCGGCAGCCTACCATCGGCAAATCGGTAGGGAAACCACGGCCCTGTGCGCCCGCGCGAGGATGACCATAATAGCCTACCATCGGCAAATCGGTAGGGAAACCACGGCTCCTTTTACGCGATGAGGGCAGTGAGCCCGGAGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC

>NC_020561|3|2|1616584-1618020|CRISPRCasFinder
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	CGGGCAAGACGGTTGGGCGACGCGCGTTTG
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	GAAGTTCGCCGGGTCTACGCACGCGCTTTC
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	CCTATGTCCGTAACAACCCGGACGTGGCCG
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	AGTGATGACTGACATCGCAACGATAGCGGC
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	CGAACGTCGCCCTGTAACAACAGCCCTGAA
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	AGCCCGCTGCAAAGGCGGATTCCGCGACGC
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	CCGAGTTGCTCGACAGCCAACGCGCTTTAG
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	GTATCTGTGCGCCAGTCGTACATTGTTGAC
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	CCTTCCACGCGTCAAGCTCACCTTCGAACC
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	TTTGGCGAAGTCCGCCCACATATGCGCGCA
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	CGCGGCGAGACCCACGTCAACAACCTGCTG
AGCCCACCATCGGCAAATCGGTAGGGAAACCACGGC	GCCCATCCCGAGCTCGCGCTTGTAGCGCAT
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	GATTCTTGCCGCGATGGCGGCGGCCCAGGC
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	ACTCGCTGCGAGGGGACGGGGAGAGGAAGG
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	CCCCCAGGGCGCATAGCCAAGCCGGCCCAC
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	AAGATATCACACAGGCGGTATTGCTGGAGGCGGTATTGCTGGTT
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	GAAACATTCGATGCGCCAGATCCAGATGAT
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	CTATGTTGACGCGCAGTTCGGTTTGGCCAA
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	CCAGCGGACGGACGCATATGGGCAAGCGGC
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	CCTGTGCGCCCGCGCGAGGATGACCATAAT
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	TCCTTTTACGCGATGAGGGCAGTGAGCCCGG
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC

>NC_020561|3|1|1616584-1618020|CRT
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	CGGGCAAGACGGTTGGGCGACGCGCGTTTG
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	GAAGTTCGCCGGGTCTACGCACGCGCTTTC
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	CCTATGTCCGTAACAACCCGGACGTGGCCG
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	AGTGATGACTGACATCGCAACGATAGCGGC
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	CGAACGTCGCCCTGTAACAACAGCCCTGAA
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	AGCCCGCTGCAAAGGCGGATTCCGCGACGC
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	CCGAGTTGCTCGACAGCCAACGCGCTTTAG
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	GTATCTGTGCGCCAGTCGTACATTGTTGAC
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	CCTTCCACGCGTCAAGCTCACCTTCGAACC
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	TTTGGCGAAGTCCGCCCACATATGCGCGCA
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	CGCGGCGAGACCCACGTCAACAACCTGCTG
AGCCCACCATCGGCAAATCGGTAGGGAAACCACGGC	GCCCATCCCGAGCTCGCGCTTGTAGCGCAT
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	GATTCTTGCCGCGATGGCGGCGGCCCAGGC
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	ACTCGCTGCGAGGGGACGGGGAGAGGAAGG
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	CCCCCAGGGCGCATAGCCAAGCCGGCCCAC
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	AAGATATCACACAGGCGGTATTGCTGGAGGCGGTATTGCTGGTT
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	GAAACATTCGATGCGCCAGATCCAGATGAT
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	CTATGTTGACGCGCAGTTCGGTTTGGCCAA
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	CCAGCGGACGGACGCATATGGGCAAGCGGC
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	CCTGTGCGCCCGCGCGAGGATGACCATAAT
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	TCCTTTTACGCGATGAGGGCAGTGAGCCCGG
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC

>NC_020561|3|2|1616716-1617609|PILER-CR
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	CCTATGTCCGTAACAACCCGGACGTGGCCG
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	AGTGATGACTGACATCGCAACGATAGCGGC
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	CGAACGTCGCCCTGTAACAACAGCCCTGAA
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	AGCCCGCTGCAAAGGCGGATTCCGCGACGC
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	CCGAGTTGCTCGACAGCCAACGCGCTTTAG
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	GTATCTGTGCGCCAGTCGTACATTGTTGAC
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	CCTTCCACGCGTCAAGCTCACCTTCGAACC
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	TTTGGCGAAGTCCGCCCACATATGCGCGCA
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	CGCGGCGAGACCCACGTCAACAACCTGCTG
AGCCCACCATCGGCAAATCGGTAGGGAAACCACGGC	GCCCATCCCGAGCTCGCGCTTGTAGCGCAT
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	GATTCTTGCCGCGATGGCGGCGGCCCAGGC
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	ACTCGCTGCGAGGGGACGGGGAGAGGAAGG
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	CCCCCAGGGCGCATAGCCAAGCCGGCCCAC
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGCAAGATATCACACAGGCGGTATTGCTGGAGGCGGTATTGCTGGTTAGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	GAAACATTCGATGCGCCAGATCCAGATGAT
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	CTATGTTGACGCGCAGTTCGGTTTGGCCAA
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	CCAGCGGACGGACGCATATGGGCAAGCGGC
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	CCTGTGCGCCCGCGCGAGGATGACCATAAT
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	TCCTTTTACGCGATGAGGGCAGTGAGCCCGG


>NC_020561|3|3|1617654-1618020|PILER-CR
	CCTATGTCCGTAACAACCCGGACGTGGCCG
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	AGTGATGACTGACATCGCAACGATAGCGGC
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	CGAACGTCGCCCTGTAACAACAGCCCTGAA
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	AGCCCGCTGCAAAGGCGGATTCCGCGACGC
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	CCGAGTTGCTCGACAGCCAACGCGCTTTAG
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	GTATCTGTGCGCCAGTCGTACATTGTTGAC
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	CCTTCCACGCGTCAAGCTCACCTTCGAACC
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	TTTGGCGAAGTCCGCCCACATATGCGCGCA
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	CGCGGCGAGACCCACGTCAACAACCTGCTG
AGCCCACCATCGGCAAATCGGTAGGGAAACCACGGC	GCCCATCCCGAGCTCGCGCTTGTAGCGCAT
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	GATTCTTGCCGCGATGGCGGCGGCCCAGGC
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	ACTCGCTGCGAGGGGACGGGGAGAGGAAGG
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	CCCCCAGGGCGCATAGCCAAGCCGGCCCAC
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGCAAGATATCACACAGGCGGTATTGCTGGAGGCGGTATTGCTGGTTAGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	GAAACATTCGATGCGCCAGATCCAGATGAT
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	CTATGTTGACGCGCAGTTCGGTTTGGCCAA
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	CCAGCGGACGGACGCATATGGGCAAGCGGC
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	CCTGTGCGCCCGCGCGAGGATGACCATAAT
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC	TCCTTTTACGCGATGAGGGCAGTGAGCCCGG
AGCCTACCATCGGCAAATCGGTAGGGAAACCACGGC

Protein	Signature genes	Signature genes Name	Protein_function
NC_020561.1\|WP_015458284.1\|1605677_1605923_-\|hypothetical-protein	unknown	unknown	unknown
NC_020561.1\|WP_015458287.1\|1610738_1610930_+\|type-II-toxin-antitoxin-system-Phd/YefM-family-antitoxin	unknown	unknown	gnl\|CDD\|273688
NC_020561.1\|WP_015458297.1\|1624323_1625310_-\|nucleotidyltransferase-domain-containing-protein	unknown	unknown	gnl\|CDD\|372012
NC_020561.1\|WP_015458293.1\|1618109_1621502_-\|class-I-SAM-dependent-DNA-methyltransferase	unknown	unknown	gnl\|CDD\|223934
NC_020561.1\|WP_015458294.1\|1621636_1622326_-\|hypothetical-protein	unknown	unknown	unknown
NC_020561.1\|WP_015458302.1\|1628225_1630091_-\|phosphomethylpyrimidine-synthase-ThiC	unknown	unknown	gnl\|CDD\|236451
NC_020561.1\|WP_015458290.1\|1615291_1616194_+\|type-II-CRISPR-associated-endonuclease-Cas1	cas1	cd09720_cas1_CAS-II-A:CAS-II-B:CAS-II-C	gnl\|CDD\|274694
NC_020561.1\|WP_144062010.1\|1611246_1611915_+\|hypothetical-protein	unknown	unknown	unknown
NC_020561.1\|WP_084673633.1\|1622336_1623329_-\|MobA/MobL-family-protein	unknown	unknown	gnl\|CDD\|367473
NC_020561.1\|WP_041864841.1\|1625486_1625708_+\|helix-turn-helix-transcriptional-regulator	unknown	unknown	gnl\|CDD\|213767
NC_020561.1\|WP_041864840.1\|1604891_1605674_-\|serine/threonine-protein-phosphatase	unknown	unknown	gnl\|CDD\|277316
NC_020561.1\|WP_015458296.1\|1623356_1623818_-\|MobA/MobL-family-protein	unknown	unknown	gnl\|CDD\|367473
NC_020561.1\|WP_187294040.1\|1606278_1609443_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|274730
NC_020561.1\|WP_015458299.1\|1625790_1626015_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|341492
NC_020561.1\|WP_015458289.1\|1612172_1615334_+\|type-II-CRISPR-RNA-guided-endonuclease-Cas9	cas9	COG3513_cas9_CAS-II-A:CAS-II-B:CAS-II-C	gnl\|CDD\|226044
NC_020561.1\|WP_015458300.1\|1626087_1626438_+\|WGR-domain-containing-protein	unknown	unknown	gnl\|CDD\|153425
NC_020561.1\|WP_015458291.1\|1616195_1616525_+\|CRISPR-associated-endonuclease-Cas2	cas2	COG3512_cas2_CAS-II-A:CAS-II-B:CAS-II-C	gnl\|CDD\|226043
NC_020561.1\|WP_015458286.1\|1610145_1610712_+\|recombinase-family-protein	unknown	unknown	gnl\|CDD\|239737
NC_020561.1\|WP_144062009.1\|1609430_1609904_+\|hypothetical-protein	unknown	unknown	unknown
NC_020561.1\|WP_144062011.1\|1623956_1624268_-\|hypothetical-protein	unknown	unknown	unknown

Protein	Function_ID	Function_description	E-value
NC_020561.1\|WP_015458290.1\|1615291_1616194_+\|type-II-CRISPR-associated-endonuclease-Cas1	gnl\|CDD\|274694	TIGR03639, cas1_NMENI, CRISPR-associated endonuclease Cas1, subtype II/NMENI. The CRISPR-associated protein Cas1 is virtually universal to CRISPR systems. CRISPR, an acronym for Clustered Regularly Interspaced Short Palindromic Repeats, is a prokaryotic immunity system for foreign DNA, mostly from phage. CRISPR systems belong to different subtypes, distinguished by both nature of the repeats, the makeup of the cohort of associated Cas proteins, and by molecular phylogeny within the more universal Cas proteins such as this one. This model is of type EXCEPTION and provides more specific information than the EQUIVALOG model TIGR00287. It describes the Cas1 variant of the NMENI subtype of CRISPR/Cas system.	9.86858e-106
NC_020561.1\|WP_015458287.1\|1610738_1610930_+\|type-II-toxin-antitoxin-system-Phd/YefM-family-antitoxin	gnl\|CDD\|273688	TIGR01552, Hypothetical_protein_Rv3357/MT3465/Mb3392., prevent-host-death family protein. This model recognizes a region of about 55 amino acids toward the N-terminal end of bacterial proteins of about 85 amino acids in length. The best-characterized member is prevent-host-death (phd) of bacteriophage P1, the antidote partner of death-on-curing (doc) (TIGR01550) in an addiction module. Addiction modules prevent plasmid curing by killing the host cell as the longer-lived killing protein persists while the gene for the shorter-lived antidote is lost. Note, however, that relatively few members of this family appear to be plasmid or phage-encoded. Also, there is little overlap, except for phage P1 itself, of species with this family and with the doc family. [Cellular processes, Toxin production and resistance, Mobile and extrachromosomal element functions, Other].	0.000580956
NC_020561.1\|WP_015458293.1\|1618109_1621502_-\|class-I-SAM-dependent-DNA-methyltransferase	gnl\|CDD\|223934	COG1002, COG1002, Type II restriction enzyme, methylase subunits [Defense mechanisms].	1.03292e-12
NC_020561.1\|WP_084673633.1\|1622336_1623329_-\|MobA/MobL-family-protein	gnl\|CDD\|367473	pfam03389, MobA_MobL, MobA/MobL family. This family includes of the MobA protein from the E. coli plasmid RSF1010, and the MobL protein from the Thiobacillus ferrooxidans plasmid PTF1. These sequences are mobilisation proteins, which are essential for specific plasmid transfer.	2.02945e-12
NC_020561.1\|WP_041864841.1\|1625486_1625708_+\|helix-turn-helix-transcriptional-regulator	gnl\|CDD\|213767	TIGR03070, couple_hipB, transcriptional regulator, y4mF family. Members of this family belong to a clade of helix-turn-helix DNA-binding proteins, among the larger family pfam01381 (HTH_3; Helix-turn-helix). Members are similar in sequence to the HipB protein of E. coli. Genes for members of the seed alignment for this protein family were found to be closely linked to genes encoding proteins related to HipA. The HibBA operon appears to have some features in common with toxin-antitoxin post-segregational killing systems. [Regulatory functions, DNA interactions].	5.26489e-18
NC_020561.1\|WP_041864840.1\|1604891_1605674_-\|serine/threonine-protein-phosphatase	gnl\|CDD\|277316	cd00144, MPP_PPP_family, phosphoprotein phosphatases of the metallophosphatase superfamily, metallophosphatase domain. The PPP (phosphoprotein phosphatase) family is one of two known protein phosphatase families specific for serine and threonine. This family includes: PP1, PP2A, PP2B (calcineurin), PP4, PP5, PP6, PP7, Bsu1, RdgC, PrpE, PrpA/PrpB, and ApA4 hydrolase. The PPP catalytic domain is defined by three conserved motifs (-GDXHG-, -GDXVDRG- and -GNHE-). The PPP enzyme family is ancient with members found in all eukaryotes, and in most bacterial and archeal genomes. Dephosphorylation of phosphoserines and phosphothreonines on target proteins plays a central role in the regulation of many cellular processes. PPPs belong to the metallophosphatase (MPP) superfamily. MPPs are functionally diverse, but all share a conserved domain with an active site consisting of two metal ions (usually manganese, iron, or zinc) coordinated with octahedral geometry by a cage of histidine, aspartate, and asparagine residues. The MPP superfamily includes: Mre11/SbcD-like exonucleases, Dbr1-like RNA lariat debranching enzymes, YfcE-like phosphodiesterases, purple acid phosphatases (PAPs), YbbF-like UDP-2,3-diacylglucosamine hydrolases, and acid sphingomyelinases (ASMases). The conserved domain is a double beta-sheet sandwich with a di-metal active site made up of residues located at the C-terminal side of the sheets. This domain is thought to allow for productive metal coordination.	2.06003e-26
NC_020561.1\|WP_015458296.1\|1623356_1623818_-\|MobA/MobL-family-protein	gnl\|CDD\|367473	pfam03389, MobA_MobL, MobA/MobL family. This family includes of the MobA protein from the E. coli plasmid RSF1010, and the MobL protein from the Thiobacillus ferrooxidans plasmid PTF1. These sequences are mobilisation proteins, which are essential for specific plasmid transfer.	1.4868e-62
NC_020561.1\|WP_187294040.1\|1606278_1609443_+\|hypothetical-protein	gnl\|CDD\|274730	TIGR03696, tRNA_nuclease_WapA, RHS repeat-associated core domain. This model represents a conserved unique core sequence shared by large numbers of proteins. It is occasional in the Archaea Methanosarcina barkeri) but common in bacteria and eukaryotes. Most fall into two large classes. One class consists of long proteins in which two classes of repeats are abundant: an FG-GAP repeat (pfam01839) class, and an RHS repeat (pfam05593) or YD repeat (TIGR01643). This class includes secreted bacterial insecticidal toxins and intercellular signalling proteins such as the teneurins in animals. The other class consists of uncharacterized proteins shorter than 400 amino acids, where this core domain of about 75 amino acids tends to occur in the N-terminal half. Over twenty such proteins are found in Pseudomonas putida alone; little sequence similarity or repeat structure is found among these proteins outside the region modeled by this domain.	3.59262e-21
NC_020561.1\|WP_015458302.1\|1628225_1630091_-\|phosphomethylpyrimidine-synthase-ThiC	gnl\|CDD\|236451	PRK09284, PRK09284, thiamine biosynthesis protein ThiC; Provisional.	0
NC_020561.1\|WP_015458289.1\|1612172_1615334_+\|type-II-CRISPR-RNA-guided-endonuclease-Cas9	gnl\|CDD\|226044	COG3513, COG3513, Predicted CRISPR-associated nuclease, contains McrA/HNH-nuclease and RuvC-like nuclease domain [Defense mechanisms].	1.28685e-119
NC_020561.1\|WP_015458300.1\|1626087_1626438_+\|WGR-domain-containing-protein	gnl\|CDD\|153425	cd07996, WGR_MMR_like, WGR domain of molybdate metabolism regulator and related proteins. The WGR domain is found in the putative Escherichia coli molybdate metabolism regulator and related bacterial proteins, as well as in various other bacterial proteins of unknown function. It has been called WGR after the most conserved central motif of the domain. The domain appears to occur in single-domain proteins and in a variety of domain architectures, together with ATP-dependent DNA ligase domains, WD40 repeats, leucine-rich repeats, and other domains. It has been proposed to function as a nucleic acid binding domain.	1.07493e-18
NC_020561.1\|WP_015458291.1\|1616195_1616525_+\|CRISPR-associated-endonuclease-Cas2	gnl\|CDD\|226043	COG3512, COG3512, CRISPR-associated protein, Cas2 homolog [Defense mechanisms].	7.40306e-37
NC_020561.1\|WP_015458286.1\|1610145_1610712_+\|recombinase-family-protein	gnl\|CDD\|239737	cd03768, SR_ResInv, Serine Recombinase (SR) family, Resolvase and Invertase subfamily, catalytic domain; members contain a C-terminal DNA binding domain. Serine recombinases catalyze site-specific recombination of DNA molecules by a concerted, four-strand cleavage and rejoining mechanism which involves a transient phosphoserine linkage between DNA and the enzyme. They are functionally versatile and include resolvases, invertases, integrases, and transposases. Resolvases and invertases affect resolution or inversion and comprise a major phylogenic group. Resolvases (e.g. Tn3, gamma-delta, and Tn5044) normally recombine two sites in direct repeat causing deletion of the DNA between the sites. Invertases (e.g. Gin and Hin) recombine sites in inverted repeat to invert the DNA between the sites. Cointegrate resolution with gamma-delta resolvase requires the formation of a synaptosome of three resolvase dimers bound to each of two res sites on the DNA. Also included in this subfamily are some putative integrases including a sequence from bacteriophage phi-FC1.	1.36444e-61
NC_020561.1\|WP_015458297.1\|1624323_1625310_-\|nucleotidyltransferase-domain-containing-protein	gnl\|CDD\|372012	pfam12281, NTP_transf_8, Nucleotidyltransferase. This is a family of bacterial proteins that have a nucleotidyltransferase fold. The fold-prediction is backed up by conservation of three highly characteristic sequence motifs found in all other nucleotidyl transferases: i) pDhDhhh(h/p), where p is a polar residue and h is a hydrophobic residue; ii) upstream of the first, a GG/S; iii) a conserved D/E in a hydrophobic surround. In the classification of nucleotidyltransferases proposed in this is a group XVIII NTP-transferase. Many of these sequences were classified in the COG database as COG5397. The exact function is not known.	2.16086e-71
NC_020561.1\|WP_015458299.1\|1625790_1626015_+\|hypothetical-protein	gnl\|CDD\|341492	cd17793, HipA, type II toxin-antitoxin sytem toxin HipA and similar proteins. This family contains type II toxin-antitoxin (TA) system HipA family toxins similar to Escherichia coli and Shewanella oneidensis HipA, which is a serine/threonine-protein kinase that phosphorylates Glu-tRNA-ligase (GltX), preventing it from being charged, leading to an increase in uncharged tRNA(Glu). This induces amino acid starvation and the stringent response via RelA/SpoT and increased (p)ppGpp levels, which inhibits replication, transcription, translation and cell wall synthesis, reducing growth and leading to persistence and multidrug resistance. HipA is the toxin component of the HipA-HipB TA module that is a major factor in persistence and bioflim formation; its toxic effect is neutralized by its cognate antitoxin HipB. HipA, with HipB, acts as a a corepressor for transcription of the hipBA promoter. Structures of HipAB:DNA complexes from both Escherichia coli and Shewanella oneidensis reveal distinct complex assembly.	4.48676e-08

>NC_020561.1|WP_015458291.1|1616195_1616525_+|CRISPR-associated-endonuclease-Cas2
MQADEVRFMWLMVFFDLPTRTKPQRRRANRFRQFLKKDGYIMLQFSVYARVCRGQDAVDKHVRRVRTSLPKEGSVRTLQVTDRQYGRMELMLGIAPKTEEIGSSQMVLL
>NC_020561.1|WP_015458290.1|1615291_1616194_+|type-II-CRISPR-associated-endonuclease-Cas1
MAWRGLHISNPARLSHRSRQIVVDPEGGSEILTFPVEDVAWIILDTPQVTLTGSLLSALAENGVAMVVPDARHHPAGMLLSFHQHHAQSAIAHSQIAMTQPLRKRLWQKLVVAKIENQAAVLRGIGHDYADTLSAMAARVGSGDPDNLEAQAARAYWQRLFADFWRHDEDRRNGLLNYGYAVVRAALARACAASGLLPAFGVHHRSRANPFNLVDDLLEPFRPAVDRLARLRALQEERDELDVADRRHMAGILGENIAIGEEHLTMLAATEAVAASLVQAIDGGNAALLNTPALPLARRG
>NC_020561.1|WP_015458289.1|1612172_1615334_+|type-II-CRISPR-RNA-guided-endonuclease-Cas9
MSGMVFGIDLGIASCGWAVLRQPQRDGDPGEIVDLGSWMFDVPETDKERTPTNQVRRGNRLLRRVIRRRAQRMVEIRRLFHDHGLLAGHAPEALKRAGLDPWDLRARSLDKVLEPAALAVALGHIAKRRGFKSAARRKEANTAGDDQKMLKALEATHERLGRYRTIGEMFARDPDFESRKRNRDGMFDRTQGRDDLLHEVGEIFKAQRRLGSALATAELEQAFTAIAFRQLPIQDSERLVGLCQFEPKEKRAARFAPSFERFRLLQRLTNLRVVTVEGERPLTADEIAAAAADLGRTAKLSVKEVRKRIGLAADHRFAAFKADEEDRDIIARTGEALHGTYRLRKALGEGLWAEMLPGQLDAIAHALSFFETQDVILKELDKLDLPAGVRDAIATGLDAGAFARFKGTGHISARAARALLPHLEAGLRYDQACTKAGYDHAASRWAKREQVADKAAFNRLVTDMGAEIANPIARKSLTEALKQLWAMRNRWGLPDAIHIELARDVGNSLEKRREIERAIEKNTAARERERGEARDLLGIDDVSGDTLLRYRLWKEQAGRCPYTDAPIPPGAIIATDNSFQVDHILPWSRFGDDSFANKVLCATAANQRKKGQTPCEWITAAQGEEGWATFVARIEGNAAFRGPKKRNYVLKNAKEAEERFRARNLNDTRYAARLLAEAVKLFYPEGERQDKGGVRRVFTRPGGLTAALRHAWGVEALKKRDGKRVDDARHHALDALVVAAIGEGEVQRLTRSYQEWEQQGLARPLRRVDPPWGDFHSFRREVKDAYDGIFVARPERRRARGEGHAATIRQVRERDGAAVVFERKAIADLSEKRLADIKDPERNQAIVEAIRQWIVDGRPADRLPRSPAGDEIRKVRLRTKGKPAVQVRGGAADRGEIVRVDVFTKPNKKGKNEFYLVPIYPHQVMNKAEWPTPPMRAVVAYKDESEWTLLDENFGFLFSLFPRSYVEVTKPGGEVLSGYFQGMDRSTGAISLFNHRDSRSLTDDSGNSTRGIGAKTLLTMKKYSVDRFGKRAEVKSEVRTWHGVACTYPTPPG
>NC_020561.1|WP_144062010.1|1611246_1611915_+|hypothetical-protein
MPFTQDELHELPTVISAPRFATYLQAMGNYREKALELYEWNLALSSALIVPLQVCEIAIRNGIAEGIELVHGATWPWSNGLIRSLPRPKKRFHYIPADDLKACAARLPTTGKIIAELKFAFWENIFTVGQETRIWNKHFRTCFPGAPAQQTISQCRITAYNDLRGIRHLRNRIAHHEPVFTRNIADDYQRIHDMIAWRNPVAAAWMDGKQTVLGLLGQRPQP
>NC_020561.1|WP_015458287.1|1610738_1610930_+|type-II-toxin-antitoxin-system-Phd/YefM-family-antitoxin
MAITTFPSRALSRHIGQVKRAARNGPVFITERRRVAYVLLSIEDYQRLLSDGEGEAAADGASP
>NC_020561.1|WP_015458286.1|1610145_1610712_+|recombinase-family-protein
MALIGYARVSTADQKLSLQQDALAHAGCERIFDDQASGAKADRPGLAEALAYLRSGDTLVVWKLDRLGRSMRHLIDAVDALAARGIGFRSLTEHIDTTTPGGMLVFNIFGALAQFERDLIRERTQAGLSAARERGSRGGRRPVVTPDKLRKARQHIAAGLTVREAAARLRIGKTALYKALESDRNDMA
>NC_020561.1|WP_144062009.1|1609430_1609904_+|hypothetical-protein
MQKMIKMPKFLFLSFFVFVSIFLIVILFLSSELLKDPCYALSLDKKDGILYNVLPANYCIPSSSLTIYGSLHEDNGNMQFTGSPRNSSEKISAILNISEQAAFDGMKGTMVPCIKNKNSHIVFENISVSGRLIKPDSQSIYRKNIILAERIMCLNHE
>NC_020561.1|WP_187294040.1|1606278_1609443_+|hypothetical-protein
MTSDIATSRVISDTDALNRTTSYQRDSFGRVTRVTAPEGNYTQFTYDARGNVTQTRSVGKSGSGLADIVKSAVYPATCGNAITCNKPTSTTDARGKVTDYTYDATHGGVLTVTAPAAPNGVRPQSRYSYTPMQAYYKNSAGSLVASGGTGILNTYVLTSTSTCKTTASCAGGADEVKTTLGYGAQVAGTANNLLPVTTSSGSGDGALTATASVTYDSIANTLTVDGALSGTADTIRYRYDAARRVVGTVSPDPDGAGALKHRATRYTYRPDGLVSQVESGTVASQSDADWAAMAVLDKAQISYDVNGRKVKEELYGGVTLEAVTQTSYDALGRVDCVAQRMNKAVFGSLPASTCTLGTAGADGPDRIAKTIYDAASQVTKVQTAYGTSLQRDEVTNTWSNNGKLLTVADAKGNKTTYEYDGFDRLSKTRFPSPTTPGTSSTTDYEQLGYDAGSNITSRRLRDGTSIAFSYDNLSRATSKDLPGTELDVSYAYDNLGRVTTATDTASNFVGAAYDALGRMTAQSSALGVFGMAYDLAGRRTKLTYPDNFYVNYDYLVTGEMTAVRESGATSGAGLLATFAYDDRGRRTSLTRGNGTVTSYGYDNASRLSQLTQNLTGTASDFTQTFTYNVGGQLTRQDRSNDLYSWTQHVNLNRSYTVNGLNQYSAITGVAPAPAYDARGNLTNGGTGTYAYSSENYLISGPGVTLSYDPSGRLLQTAGSVTKRFAYDGANLAAEYSSTGVLQQRYVHGSDVDEPLVWYEGSGTTDRRWLHADERGSVIAVSDSAGNTIAINAYDEYGIPQSTNLGRFQYAGQTWLPELGLYYYKARIYSPTFGRFLQTDPIGYNAGMNIYAYANSDPVNLVDDSGNSPTNGVNLYDILNSLIRNDNRSRRFGVEYAQKLTYWPSMGFTYYSSYFRGERNQANVPSCSYCNVITHSHYTDFNVAGNENLSPDDINLSESIGKPIWGIMPNSTVKAYDPSSDMLYTLVKIDSSGNSLGAFSFGDLKGDIITKVTELKDGTFKVSYQTRNGGMGQIRVGLEGSQCSKSKDGGTVCKK
>NC_020561.1|WP_015458284.1|1605677_1605923_-|hypothetical-protein
MNENREAWCLRPAVLAADRGLRDAYADAIRTGVERSTLISYRKRWARLRNRSSDEPRYLIGSYRALAEELASLSDQARMGR
>NC_020561.1|WP_041864840.1|1604891_1605674_-|serine/threonine-protein-phosphatase
MALAPPPSAAPVRPGSVEGGLVYAIGDVHGCYDQLCGLLGRVMEDIAGRGAGRRPILIFCGDYIDRGPQSAEVLDALCWLDRRAGFELHLLKGNHEQALLDFLEMPEDGEGWLEFGGVATLASYGVAPPAADLGPQDFRRARNELLDRMPAGHLRLLQRLELIVSLGDYAFVHAGIRPGIALDRQDEDDLLWIRRDFLDAAGPHEKIIVHGHSWADARPDIGPHRIGIDTGAYQTGVLTALRLEDGGIQAIQFGAEERLS
>NC_020561.1|WP_015458293.1|1618109_1621502_-|class-I-SAM-dependent-DNA-methyltransferase
MDKADRVESFIDRWRGGEGGAERANYALFLVELVDLLDLPRPDPAEATRDRNDYVFERAVRRTDRDGKESIGRIDLYRRGCFVLEAKQSRWKNQAKEVQVPAAQLPLPAFAEPEILGRRNAARNWDVLMHNAREQAEQYARALEPDHGWPPFLIICDVGHCLELFADFSGQGKNYRQFPDRAGFRIYLDDLRDEAVRRMLRAIWLDPHSLDPARKSAAVTREIARRLAKVSKALEDRGHAPEKVAHFLMRCLFTMFSEDVGLLERGCFTQLLEESTATPASFAPLLEDLWRVMDKGGFSPVLHRPVRHFNGKLFADASAIPLQREDIGELLAAARHDWTQVEPAIFGTLLEQALDPGDRRQLGAHYTPRAYVEQLVVATVIAPLRAQWERVVLGTVERERVDHPGRAIGAVREFHAQLAQTRVLDPACGTGNFLYVALELMKQLEGEVLETLAALGGQEALALETMSVDPRNFLGLEINPRAAAIAELVLWLGYLQWHLRGGGAISDPVLQSFGNIACRDAVLAHDPERPKADGSGTERPNARPPEWPEADYIVGNPPFIGGKDLRSRLPAGYVEALWRAHPHINRSADFVMYWWDRAAELLTQKGTRLKRFGFVTTNSITQEFSRRVIAKRIEGRVPLHLVLAIADHPWTKASRDAAAVRIAMTVAEAGAGDGQLRTVVAEVALDSDQPVISMTVTDGRINADLTIGANLMEVVALRANGGLGSRGVSLHGAGFIVSPQEAEHLGLGRADGLERHIRPYRNGRDLAGRARGAMVIDLFGLDEATVRRRFPDVFGHVWRRVKPERDTNNRATYRDNWWIFGEPRRDLRPALEGLPRYIATVETAKHRVFQFLDAAILPDNMLVCIASDDAFHLGVLSSRIHVTWALRAGGWLGVGNDSRYSKSRTFDPFPFPEATAALRARIADVAEELDSTRKTVLAVQGDLTLTGLYNLRDKIERHEPLDMVEQDQRVRGRIDIICALHAHLDRVVAEAFGWPTDLADEDIVARLVALNAARHQEERNGIVRWLRTDYQLGRAGIEQLGLKVDVPDRIAAHHSSSSIRKPAFPRDAIGQTAAVLEALRSAPLLSAEAIADRYSNGHKALPRIGATLSALTRLGHVAAEGGDYSLRRAA
>NC_020561.1|WP_015458294.1|1621636_1622326_-|hypothetical-protein
MTFWEWIAVNKEQLGILITGAGVPLLLWQVTQSGRQERRRLRRRHAAARSTLPLTLSAICAYAGRAGAELRPMFYFYRGRGPHLEFTPPVASDQIIAAIERMIEAASKEEIAHRLADIASRMQVLSARMNGLVVSPSVFRSLVGELILDAAEIDALASSLFAFARRHTEKAPPPLTKSDIRNALHRIGCDEERDSEIYTALGETPQWQALPPWWRRLGNRFHKPILAEY
>NC_020561.1|WP_084673633.1|1622336_1623329_-|MobA/MobL-family-protein
MLRDWREQWAEIQNRHLRRHLGPDTPQVTHLSLDGQGVDREPMQHLGPTASAIERKGERSERGDINRDIHAANAERAAWKVRKREIEDELVRRTPHQPSSPQSLQAELRTLRDAMVAERAKWQAEVAAIGKPAVLKPYEVRRAILDPARTRLAQAERDLSATRERVQRLSTRRMQLAHWVKNPQRMIWAKIREVHAIDRARRDVARAKAGLRLREQWLGSEQGRAYVLAQVDRSHAAAKPLLGRRRTLARKIARASKRIERVDKLQQKLRVAEKLGVGAIARPVHVRSPDQLIRSIDQTVMRMARSFSPQQQQHALQQVRAIGRVIGLEW
>NC_020561.1|WP_015458296.1|1623356_1623818_-|MobA/MobL-family-protein
MAQYRFSAQVISRRDGRSAVAAAAYRAGERLHDERLDMPFDYARRDGVEHSEILLPEGAPARFADRHIVWNAVEAVERRSDAQVAREVQLSLPHELTFEQRLELVRDFARTAFTDRGMIADIALHRPDRHGDERNFHAHILLTTRAIAGESFG
>NC_020561.1|WP_144062011.1|1623956_1624268_-|hypothetical-protein
MVRRFQLYSACAEPGSRATGPSPSAAPCSGAKGARADLSPIVTGGTADNPRSRANALAWFAAWNARTDRSWTMHPVTIDGGTHAANATDAYRTGLRLLFRPDE
>NC_020561.1|WP_015458297.1|1624323_1625310_-|nucleotidyltransferase-domain-containing-protein
MTGRSIAAPLQTLFAELLQQAETTDPAGSVYERTRDGITYLYAKLPVGTTRVDRFLGRADDAAAVALAEAMRQGAAQARERRSLVAMLKRGGLAGPDRRLGAALDAIAYAGLFRGGAVLVGTAAYMMSGPLVGHLLPAPTLMTGDLDLATASLALSADPPERMEAILRRADPSFQAIMPLDPGNPASRFRSGDGYLVDLVTPQRSRADPNPKPLKALEAGAAPLQHLAWLIADPVASVALWGAGIPVTIPQPARFAVHKLILAQRREGAHRLKRAKDLAQAQALMAALQRFDPFLLEDALDSARAMGKAGWADPIDRSLKEIARSANP
>NC_020561.1|WP_041864841.1|1625486_1625708_+|helix-turn-helix-transcriptional-regulator
MMTTIPSPQALGAAVRTARKAAGLRQDELAGVAGVGTRFIVELEAGKPTLQLGKVLAVLAALGLTLHLDGGPA
>NC_020561.1|WP_015458299.1|1625790_1626015_+|hypothetical-protein
MRIGRAGTIDELDGEAWARFATDAGITFPFFRRRVSALTERIEAAIAGGEDVADVAELRERTMLRARLVWQTTG
>NC_020561.1|WP_015458300.1|1626087_1626438_+|WGR-domain-containing-protein
MSTIANLACPVHLEAIDSARNMARGYSLWMSRDLFGEWVVETRWGRIGARGQSQVVSFVDGAAARAYVRSVLRRRAGLRRRGGVGYRLVAPCPFSPSSMKLENLMGLEGLIEGLEG
>NC_020561.1|WP_015458302.1|1628225_1630091_-|phosphomethylpyrimidine-synthase-ThiC
MADIPARTEMTVTTGPIRGSRKIHVGPLGVAMREIDLEPSSGEPPLRVYDCSGPYTDPQARIDIMAGLPELRRDWIRGRGDVEEYAGRAVKPEDNGLSGAIGRNGAVQPFPNVRQRPLRAKAGANVSQMHYAKRGIITPEMEYVAVRENLGREMLKDKLVRDGQDWGASIPDYVTPEFVRDEVARGRAIIPSNINHPESEPMAIGRNFLVKINANIGNSAVASSVAEEVEKMVWAIRWGADTVMDLSTGRNIHDTREWILRNSPVPIGTVPIYQALEKVGGIAEDLTWEIFRDTLIEQAEQGVDYFTIHAGVRLPYIPLTARRVTGIVSRGGSIMAKWCLAHHRESFLYEHFDEITEIMKAYDIAYSLGDGLRPGSIADANDEAQFAELYTLGELTKRAWEQDVQVMIEGPGHVPMHKIKENMDKQLEACGEAPFYTLGPLTTDIAPGYDHITSGIGAAMIGWYGTAMLCYVTPKEHLGLPDRDDVKVGVVTYKLAAHAADLAKGHPAAKLRDDALSRARFEFRWRDQFNLSLDPDTAEQYHDQTLPAEGAKTAHFCSMCGPKFCSMKITQEVRDFAAKQNQPADSFLAAEAAEAGMAEMSKVFKETGGELYMGAGGREHD

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_020561_4

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_020561_4

1787810-1787889

Orphan

Consensus_repeat	Method
GACGTTGGTTGCGGGGACAGGAT	CRISPRCasFinder

1 spacers

The CRISPR arrays of NC_020561_4

>merge|NC_020561|4|1787810-1787889|CRISPRCasFinder
GACGTTGGTTGCGGGGACAGGATGCCCCGTCAGTATAACAATCTTCGGAATTATGCTGACGGTGGTTGCGGGGACAGGAT

>NC_020561|4|3|1787810-1787889|CRISPRCasFinder
GACGTTGGTTGCGGGGACAGGAT	GCCCCGTCAGTATAACAATCTTCGGAATTATGCT
GACGGTGGTTGCGGGGACAGGAT

Protein	Signature genes	Signature genes Name	Protein_function
NC_020561.1\|WP_144062016.1\|1793365_1793728_+\|hypothetical-protein	unknown	unknown	unknown
NC_020561.1\|WP_015458451.1\|1777379_1778294_+\|HEPN-domain-containing-protein	unknown	unknown	gnl\|CDD\|214800
NC_020561.1\|WP_015458449.1\|1776616_1776913_+\|type-II-toxin-antitoxin-system-Phd/YefM-family-antitoxin	unknown	unknown	gnl\|CDD\|273688
NC_020561.1\|WP_015458461.1\|1794412_1794709_+\|hypothetical-protein	unknown	unknown	unknown
NC_020561.1\|WP_084673635.1\|1796717_1797632_+\|RcnB-family-protein	unknown	unknown	gnl\|CDD\|378715
NC_020561.1\|WP_144062015.1\|1783671_1784682_+\|cupin-domain-containing-protein	unknown	unknown	gnl\|CDD\|378976
NC_020561.1\|WP_015458453.1\|1780605_1780989_+\|hypothetical-protein	unknown	unknown	unknown
NC_020561.1\|WP_015458467.1\|1798387_1800226_+\|DUF885-domain-containing-protein	unknown	unknown	gnl\|CDD\|377577
NC_020561.1\|WP_015458450.1\|1776909_1777362_+\|type-II-toxin-antitoxin-system-VapC-family-toxin	unknown	unknown	gnl\|CDD\|350313
NC_020561.1\|WP_015458455.1\|1782542_1783610_-\|aldo/keto-reductase	unknown	unknown	gnl\|CDD\|381306
NC_020561.1\|WP_015458462.1\|1794705_1795098_+\|acyl-CoA-thioesterase	unknown	unknown	gnl\|CDD\|239526
NC_020561.1\|WP_015458457.1\|1784791_1785907_-\|VIT1/CCC1-transporter-family-protein	unknown	unknown	gnl\|CDD\|153124
NC_020561.1\|WP_015458468.1\|1800586_1800805_-\|hypothetical-protein	unknown	unknown	unknown
NC_020561.1\|WP_144062013.1\|1781301_1781598_-\|helix-turn-helix-domain-containing-protein	unknown	unknown	gnl\|CDD\|225117
NC_020561.1\|WP_015458458.1\|1786139_1787471_+\|ferric-reductase-like-transmembrane-domain-containing-protein	unknown	unknown	gnl\|CDD\|226582
NC_020561.1\|WP_041864851.1\|1779130_1780486_+\|ImmA/IrrE-family-metallo-endopeptidase	unknown	unknown	gnl\|CDD\|368753
NC_020561.1\|WP_015458460.1\|1793904_1794333_-\|CBS-domain-containing-protein	unknown	unknown	gnl\|CDD\|341391
NC_020561.1\|WP_015458464.1\|1796070_1796625_+\|(2Fe-2S)-binding-protein	unknown	unknown	gnl\|CDD\|224991
NC_020561.1\|WP_015458466.1\|1797852_1798284_+\|RcnB-family-protein	unknown	unknown	gnl\|CDD\|378715
NC_020561.1\|WP_015458463.1\|1795113_1795902_-\|dioxygenase	unknown	unknown	gnl\|CDD\|153375

Protein	Function_ID	Function_description	E-value
NC_020561.1\|WP_015458451.1\|1777379_1778294_+\|HEPN-domain-containing-protein	gnl\|CDD\|214800	smart00748, HEPN, Higher Eukarytoes and Prokaryotes Nucleotide-binding domain.	8.75436e-09
NC_020561.1\|WP_015458449.1\|1776616_1776913_+\|type-II-toxin-antitoxin-system-Phd/YefM-family-antitoxin	gnl\|CDD\|273688	TIGR01552, Hypothetical_protein_Rv3357/MT3465/Mb3392., prevent-host-death family protein. This model recognizes a region of about 55 amino acids toward the N-terminal end of bacterial proteins of about 85 amino acids in length. The best-characterized member is prevent-host-death (phd) of bacteriophage P1, the antidote partner of death-on-curing (doc) (TIGR01550) in an addiction module. Addiction modules prevent plasmid curing by killing the host cell as the longer-lived killing protein persists while the gene for the shorter-lived antidote is lost. Note, however, that relatively few members of this family appear to be plasmid or phage-encoded. Also, there is little overlap, except for phage P1 itself, of species with this family and with the doc family. [Cellular processes, Toxin production and resistance, Mobile and extrachromosomal element functions, Other].	4.7786e-11
NC_020561.1\|WP_015458464.1\|1796070_1796625_+\|(2Fe-2S)-binding-protein	gnl\|CDD\|224991	COG2080, CoxS, Aerobic-type carbon monoxide dehydrogenase, small subunit CoxS/CutS homologs [Energy production and conversion].	1.12474e-69
NC_020561.1\|WP_084673635.1\|1796717_1797632_+\|RcnB-family-protein	gnl\|CDD\|378715	pfam11776, RcnB, Nickel/cobalt transporter regulator. RcnB is a family of Proteobacteria proteins. RcnB is required for maintaining metal ion homeostasis, in conjunction with the efflux pump RcnA, family NicO, pfam03824.	9.15634e-12
NC_020561.1\|WP_144062015.1\|1783671_1784682_+\|cupin-domain-containing-protein	gnl\|CDD\|378976	pfam12852, Cupin_6, Cupin. This is a family of bacterial and eukaryotic proteins that belong to the Cupin superfamily. Some of the proteins in this family are annotated as being members of the AraC family of transcription factors, in which case this domain corresponds to the ligand binding domain.	3.35278e-32
NC_020561.1\|WP_015458467.1\|1798387_1800226_+\|DUF885-domain-containing-protein	gnl\|CDD\|377577	pfam05960, DUF885, Bacterial protein of unknown function (DUF885). This family consists of several hypothetical bacterial proteins several of which are putative membrane proteins.	0
NC_020561.1\|WP_015458450.1\|1776909_1777362_+\|type-II-toxin-antitoxin-system-VapC-family-toxin	gnl\|CDD\|350313	cd18746, PIN_VapC4-5_FitB-like, uncharacterized subgroup of the PIN_VapC4-5_FitB-like subfamily of the PIN domain superfamily. The PIN_VapC4-5_FitB-like subfamily includes the Virulence associated protein C (VapC)-like PIN (PilT N terminus) domain of Mycobacterium tuberculosis VapC4 and VapC5 ribonuclease toxins of the VapBC toxin/antitoxin (TA) system, and Neisseria gonorrhoeae FitB toxin of the FitAB TA system. This subfamily belongs to the VapC-like family of the PIN domain nuclease superfamily. VapC is the PIN-domain ribonuclease toxin from prokaryotic VapBC toxin-antitoxin (TA) systems. VapB is a transcription factor-like protein antitoxin acting as an inhibitor. Other members of the VapC-like nuclease family include eukaryotic ribonucleases such as Smg6, ribosome assembly factor NOB1, exosome subunit Rrp44 endoribonuclease and rRNA-processing protein Fcf1. The structural properties of the PIN (PilT N terminus) domain indicate its active center, consisting of three highly conserved catalytic residues which coordinate metal ions, in some members, additional metal coordinating residues can be found. Some members of the superfamily lack several of these key catalytic residues. The PIN active site is geometrically similar in the active center of structure-specific 5' nucleases, PIN-domain ribonucleases of eukaryotic rRNA editing proteins, and bacterial toxins of toxin-antitoxin (TA) operons.	1.57751e-45
NC_020561.1\|WP_015458455.1\|1782542_1783610_-\|aldo/keto-reductase	gnl\|CDD\|381306	cd19080, AKR_AKR9A_9B, AKR9A and AKR9B families of aldo-keto reductase (AKR). The AKR9A family includes Aspergillus nidulans sterigmatocystin biosynthesis dehydrogenase StcV, Aspergillus flavus norsolorinic acid reductase (NOR), and Phanerochaete chrysosporium aryl-alcohol dehydrogenase [NADP(+)] (AAD), are founding members of aldo-keto reductase family 9 member A1-3 (AKR9A1-3), respectively. StcV may be involved in the dehydration of 5'-hydroxyaverantin to form averufin. NOR is involved in aflatoxin biosynthesis. AAD (EC1.1.1.91) is involved in lignin degradation and reduces aromatic benzaldehydes to their respective alcohols in the presence of NADP(H). The AKR9B family includes Saccharomyces cerevisiae aryl-alcohol dehydrogenases AAD14p, AAD3p, AAD4p, and AAD10p, which are founding members of aldo-keto reductase family 9 member B1-4 (AKR9B1-4), respectively.	3.39175e-165
NC_020561.1\|WP_015458462.1\|1794705_1795098_+\|acyl-CoA-thioesterase	gnl\|CDD\|239526	cd03442, BFIT_BACH, Brown fat-inducible thioesterase (BFIT). Brain acyl-CoA hydrolase (BACH). These enzymes deacylate long-chain fatty acids by hydrolyzing acyl-CoA thioesters to free fatty acids and CoA-SH. Eukaryotic members of this family are expressed in brain, testis, and brown adipose tissues. The archeal and eukaryotic members of this family have two tandem copies of the conserved hot dog fold, while most bacterial members have only one copy.	7.24887e-40
NC_020561.1\|WP_015458457.1\|1784791_1785907_-\|VIT1/CCC1-transporter-family-protein	gnl\|CDD\|153124	cd02433, Nodulin-21_like_2, Nodulin-21 and CCC1-related protein family. Nodulin-21_like_2: This is a family of proteins closely related to nodulin-21, a plant nodule-specific protein that may be involved in symbiotic nitrogen fixation. This family is also related to CCC1, a yeast vacuole transmembrane protein that functions as an iron and manganese transporter. .	1.20859e-76
NC_020561.1\|WP_144062013.1\|1781301_1781598_-\|helix-turn-helix-domain-containing-protein	gnl\|CDD\|225117	COG2207, AraC, AraC-type DNA-binding domain-containing proteins [Transcription].	1.9979e-24
NC_020561.1\|WP_015458458.1\|1786139_1787471_+\|ferric-reductase-like-transmembrane-domain-containing-protein	gnl\|CDD\|226582	COG4097, COG4097, Predicted ferric reductase [Inorganic ion transport and metabolism].	4.51347e-89
NC_020561.1\|WP_041864851.1\|1779130_1780486_+\|ImmA/IrrE-family-metallo-endopeptidase	gnl\|CDD\|368753	pfam06114, Peptidase_M78, IrrE N-terminal-like domain. This entry includes the catalytic domain of the protein ImmA, which is a metallopeptidase containing an HEXXH zinc-binding motif from peptidase family M78. ImmA is encoded on a conjugative transposon. Conjugating bacteria are able to transfer conjugative transposons that can, for example, confer resistance to antibiotics. The transposon is integrated into the chromosome, but during conjugation excises itself and then moves to the recipient bacterium and re-integrate into its chromosome. Typically a conjugative tranposon encodes only the proteins required for this activity and the proteins that regulate it. During exponential growth, the ICEBs1 transposon of Bacillus subtilis is inactivated by the immunity repressor protein ImmR, which is encoded by the transposon and represses the genes for excision and transfer. Cleavage of ImmR relaxes repression and allows transfer of the transposon. ImmA has been shown to be essential for the cleavage of ImmR. This domain is also found in in metalloprotease IrrE, a central regulator of DNA damage repair in Deinococcaceae, HTH-type transcriptional regulators RamB and PrpC.	0.000536117
NC_020561.1\|WP_015458460.1\|1793904_1794333_-\|CBS-domain-containing-protein	gnl\|CDD\|341391	cd04623, CBS_pair_bac_euk, Two tandem repeats of the cystathionine beta-synthase (CBS pair) domains present in bacteria and eukaryotes. The CBS domain, named after human CBS, is a small domain originally identified in cystathionine beta-synthase and is subsequently found in a wide range of different proteins. CBS domains usually occur in tandem repeats. They associate to form a so-called Bateman domain or a CBS pair based on crystallographic studies in bacteria. The CBS pair was used as a basis for this cd hierarchy since the human CBS proteins can adopt the typical core structure and form an intramolecular CBS pair. The interface between the two CBS domains forms a cleft that is a potential ligand binding site. The CBS pair coexists with a variety of other functional domains and this has been used to help in its classification here. It has been proposed that the CBS domain may play a regulatory role, although its exact function is unknown. Mutations of conserved residues within this domain are associated with a variety of human hereditary diseases, including congenital myotonia, idiopathic generalized epilepsy, hypercalciuric nephrolithiasis, and classic Bartter syndrome (CLC chloride channel family members), Wolff-Parkinson-White syndrome (gamma 2 subunit of AMP-activated protein kinase), retinitis pigmentosa (IMP dehydrogenase-1), and homocystinuria (cystathionine beta-synthase).	5.16257e-45
NC_020561.1\|WP_015458466.1\|1797852_1798284_+\|RcnB-family-protein	gnl\|CDD\|378715	pfam11776, RcnB, Nickel/cobalt transporter regulator. RcnB is a family of Proteobacteria proteins. RcnB is required for maintaining metal ion homeostasis, in conjunction with the efflux pump RcnA, family NicO, pfam03824.	1.3488e-12
NC_020561.1\|WP_015458463.1\|1795113_1795902_-\|dioxygenase	gnl\|CDD\|153375	cd07363, 45_DOPA_Dioxygenase, The Class III extradiol dioxygenase, 4,5-DOPA Dioxygenase, catalyzes the incorporation of both atoms of molecular oxygen into 4,5-dihydroxy-phenylalanine. This subfamily is composed of plant 4,5-DOPA Dioxygenase, the uncharacterized Escherichia coli protein Jw3007, and similar proteins. 4,5-DOPA Dioxygenase catalyzes the incorporation of both atoms of molecular oxygen into 4,5-dihydroxy-phenylalanine (4,5-DOPA). The reaction results in the opening of the cyclic ring between carbons 4 and 5 and producing an unstable seco-DOPA that rearranges to betalamic acid. 4,5-DOPA Dioxygenase is a key enzyme in the biosynthetic pathway of the plant pigment betalain. Homologs of DODA are present not only in betalain-producing plants but also in bacteria and archaea. This enzyme is a member of the class III extradiol dioxygenase family, a group of enzymes which use a non-heme Fe(II) to cleave aromatic rings between a hydroxylated carbon and an adjacent non-hydroxylated carbon.	4.57853e-104

>NC_020561.1|WP_015458458.1|1786139_1787471_+|ferric-reductase-like-transmembrane-domain-containing-protein
MRLTRLKLVPVALTLVLVAAWLLSLRTGALTGGFWALRHELIYLTGILAIGFMAAGVVLAARPVQIEGALGGLDKFYRLHKWFGVGGLLLALAHWLLEIIPRWMVGQGWLVRPSRLRASGPAADANLLDSLRGVATELGEIALYILIVLVLLALWKKFPYRWFFKAHRLMAPIFLVLVFHAVVLMDRSYWTAPLGPLMIVLLAAGTVAATTALFRRIGYSRRAAGVITRLVTYPGNAVLDVAVDVGTAWPGHQAGQFVFLKTDDREGAHPFTISSAWHNDGHLLFNIKGLGDYTRKLPDLLRVGQPVTIEGPYGRFDFGGECARQVWIAGGVGITPFIARLQALAQARQERDIDLFYSTGAPDEDFVGQVRDLTEKAGIRFNLLVTPRDGFLTLDRLADLVPDWIEADIWFCGPAAFGRSLYVAMTSRGLPGSQFHQELFEMR
>NC_020561.1|WP_015458457.1|1784791_1785907_-|VIT1/CCC1-transporter-family-protein
MAEPNALPRYRSNLQGEVDGAAIYAALAESEADPKLAEVFRRLAAVEQAHGDFWRKRIEANGANFRPSPSTRARILAWLARRFGPAFVLPTLAANETRDSAAYDNQPEARGAGLPADERSHALLMRAAAGKGGLSGPTLALLEGRHRGGGNTLRAAVLGANDGLVSNMSLVMGVAGAAAAQQTLLLTGLAGLVAGACSMAMGEWLSVTSSRELYQSQIATEAEELREVPDEEREELVLIYQAKGIDESQARALADKLLSNEGTALDTLAREELGIDPDQLGGSAWTAATWSFLLFSAGAIVPVAPFLFLSGRTALIASLGASGVALALIGAGTSLFTGRSALFSAVRQLIIGLAAAGVTYGAGAIVGISLG
>NC_020561.1|WP_144062015.1|1783671_1784682_+|cupin-domain-containing-protein
MLDRARFMRDGTTMRADPLSDVLDLADARCVLTGTLVAGGGWARKFNRSDAVKFLAVVRGTCWLSTEADTADPARFEAGDVVITNGAPAIILASTAEWLANAPSTPLERDAEGNLRAGEGSEFTMIGGLLEVDKQRCGFLRESLPPMVHVNGQRGEAAKLRWLLTELAEETQRKRAGSTTAITHLAKLLFVEALRLHIEATKSDRSGWLTALDDRRISIALRGIHAEPSHAWNLEKLAKLSGMSRTSFAVRFRDVVGVPPLTYVLNWRMRLAERELSETDHSVADIAWSIGYGSESAFSNAFSRSTGVSPGRFRKEAMHTYSERRRKVDRSAIDVD
>NC_020561.1|WP_015458455.1|1782542_1783610_-|aldo/keto-reductase
MPLDHFITLGRSGLRVSPLCLGTMTFGEDFGWGASEAESHAMLSEYRNRGGNFIDTANIYTAGHSEEIVGNYLRQSDLRRDGIVLSTKFYCSLFPGDPNGGGAGRKALIQQCEASLKRLQTDYIDVYWLHNWDQTAPVEETLRGLDDLVTAGKIRYVGFSDVPAWKTAEAQTIAHFRGWAPIIALQLEYSLLERTSEGELFPMAQGMGMGVMPWSPLKSGFLSGKFRRGDAGHVDTRRTAMVGVPSEADYDIIEAVADVASELGVSSASVALAWVRSRAGVSSTLIGARRVDQLKANLDSLDVTLSSEQMKTLDDISRPKLNFPAENNETLAPMLAFPGLTVDGRTLPSMARLSA
>NC_020561.1|WP_144062013.1|1781301_1781598_-|helix-turn-helix-domain-containing-protein
MMRDNLGSAISISEVASLCRLSLCYFVRAFTNTVGIAPYAWFVQQRIVCAKGLLADTALPLVQVALECGFSDQAHFTKAFAKASGITPAKWRRQICTS
>NC_020561.1|WP_015458453.1|1780605_1780989_+|hypothetical-protein
MSDEKVPDEAMRRIALALVEHCVRNTRLEDLHAGTVPDSLIGDYSDVKVVTPYGEIPWTQASRISDAEMKALMIDIVNKVYTFLTHLEDVVVLRDSARWNRPEHDPALLAVAKRRAAARGADDERKE
>NC_020561.1|WP_041864851.1|1779130_1780486_+|ImmA/IrrE-family-metallo-endopeptidase
MILIDGEPAWPVPGETEALVEIQIDDLLAHLTDFWKPLMLRQVYPIDAAPSRPSTLRSIAEAEWEHMQPEAAAAEDEAITRFEEAHDLSHAFAGLYGLPPFWMMRSGEDYILESSRALWRLPFDDVRASLNATGDWICARLHEADAERWQDAIAAWQERDAGDAAGLLAWSTGLDRDLATSLLKEGALEPPQNFNDAANDNDELRIAARMAGALPADQIREIIGLARQFAGHEAEALKALAADAQAMIAERFPHAKPFEQGEAAARFVRERLSITADRAVKVFEMATSLGIELRHNPAEPPSLDGLAIWGPRHGPGVFLNEASGRILGRDDRDVEASLGARVTMAHELCHLLLDGEHALSAIEVLKARMPAGVEQRAKSFAGEFLVPTDIAAEFWHRAKRPVDRAGLDAVVRELIEIYEVTRSVAAWKVEHAARRHAVDLSATLDSVAPHR
>NC_020561.1|WP_015458451.1|1777379_1778294_+|HEPN-domain-containing-protein
MKTELDHLPVNKRRELDRVIQIIFEEFEDALGQPTGPRKLGRILKIILYGSYATGRWVHEPHTERGYRSDFDLLIIVNQKELTDRAEYWEKAEERLDRETMILNRLRTPVNFIVHTLQEVNDGLAHGRYFFMDLARDGIALYQVDNSELHEPRPKTPQQAYDMAKEYFDQWFDLAVSSRMLFQFAYDNKQFPDAAYNLQQACERLYYCVLLVYTFYTPYSHNIKFLRTRAEKISARLLDAWPRETRKQEAYFNKLKDAYVKARHSKHFKMTEEEFAFLAERVEVLGTIVNELCQERLSELRAQL
>NC_020561.1|WP_015458450.1|1776909_1777362_+|type-II-toxin-antitoxin-system-VapC-family-toxin
MKGWLLDTHIVSALANPNGASSVKAWATAQPEHRMYLSVLTLAEYDKGIHNLEPDHPDRSRYVAARDALAERFSNRLLSIDDAIVFRWGAISGEVKRRIGQSPPMIDALLAATAIEHDLFLVTRNIKDTRHSGAVIFNPWEDEPSRFPLT
>NC_020561.1|WP_015458449.1|1776616_1776913_+|type-II-toxin-antitoxin-system-Phd/YefM-family-antitoxin
MGTATRKGDRDQSVPGGTWKLEDAKARFSEVVRRAQSEGPQRVTVRGREAVVVMSVDELDRLMPKDADKPAFVPFLESLGLDGLDLEREIDRGRDVAL
>NC_020561.1|WP_144062016.1|1793365_1793728_+|hypothetical-protein
MNQHFKEPFLHKYTWYMHIRTFERPGFFRSSDALKPSETGAAAHMSLHQSNNEKEPTAPHPSLRKLGDRFTDLERRVSNPENRVTAAGDRASMPTAPHRQLPISNFIAILSQLTEKYKRI
>NC_020561.1|WP_015458460.1|1793904_1794333_-|CBS-domain-containing-protein
MTIATILGGKGHDVISVSTGTRVAEVVSLIASKRIGAVPVMDGASVAGILSERDIIYKLQSDGAAILDWPVERVMTAPAITVTGDVPVLHALSLMTKRRIRHLPVVEDGRLAGLVSIGDLVKARIDRIEAEATAMRDYIQGV
>NC_020561.1|WP_015458461.1|1794412_1794709_+|hypothetical-protein
MEAMTEHRPPHSDPRRLSPSWSHYWRLMRWMVLAAIVAVAAALYYLHVEGGLVSIHMVIATIAGVGASVLLGAGLMLLVFMSSGSGHDEDVGGRKDRP
>NC_020561.1|WP_015458462.1|1794705_1795098_+|acyl-CoA-thioesterase
MTDATSAHHPRDPILRVVPRPGDINSNGHIFGGWVLSQMDIAGGIVAHRETKGATATVAIDSMAFIAPILLHDLISVYAEVERRGRTSLAIRIEVIATRDAGAQEVKVTEGLFTFVALDENHRPRPLPPR
>NC_020561.1|WP_015458463.1|1795113_1795902_-|dioxygenase
MRQPSFFIPHGGGPCFFMDDPAGMWTRMEAFLAGFVAGLPERPKALLVVSGHWEEDAFTVQDGARPGLLYDYYGFPPHTYQLHWDAPGAPDVARRAAGLLADAGFATARDAERGWDHGVFVPMKVAVPGADIPTAQLSLRKDLDPAAHIAAGRALAPLRDEGVLIVGSGMSFHNMRVRDGDATGPADIFDAALTAAATDPDPEARARRLSAWSMLPHARFAHPREEHLIPLMVAAGAGGDDPAAHVFADHVIGWKVSGYRFG
>NC_020561.1|WP_015458464.1|1796070_1796625_+|(2Fe-2S)-binding-protein
MTRFTVNGQPVHYRMDPETPLLWALRDASNLTGTKYGCGAGLCGACTVHIDGAAVRSCQVPIGSIEGSFVTTIEALSRDRSHPVQQAWVAESVPQCGYCQSGIIMAVAAMLEKNPNPSDADIDAEITNICRCGTYPRIRRAIRHAARVAAGGETIAAAPPPGIDPEDAARAIPALTPPKPTGKE
>NC_020561.1|WP_084673635.1|1796717_1797632_+|RcnB-family-protein
MCAWARSMDMVRGTLVALLLAATAATPALAQSQGWHGQGSQGRSWQGQTGGRGDIGRPGGRMEGPAQRPDTARPAPSANASPRWNGSIARGNSAEGARGPQRPAPQRAGLSGNEDGRDRAALRRGDSWSADPRTRPGSQPADSRYRDRTIRYGDRDAINGRPGNNWNDRDRPGRDNRWDNRERWDDRRDRDRRDNQWDNRNRWSQGWRNDNRYDWQHYRQSNRYIYRLPVYYGPAGHGGYRRWAPGYRLPGVYYVRSYWISDPWYYRLPPIYGPYRWVRYYDDVLLIDTTTGLIEDVIPGFFWR
>NC_020561.1|WP_015458466.1|1797852_1798284_+|RcnB-family-protein
MRKLIISALIAATAMPLAAQAQTAELKRDRQDIRMAQRYGDRHDVRDAKREYREDWQDYRRNHRDVYRRPAYVGPRGYVYRPVAVGARLGAPYYASRYVISDPYRYRLPKPTGVNRWVRYGNDVLLVNVRTGRVIEAHRAFFW
>NC_020561.1|WP_015458467.1|1798387_1800226_+|DUF885-domain-containing-protein
MAVRHLLLASAVSLLAALPANAEAQSPAPVAAASQSAHDQLHALFHASDEASLKRNPINAIFRGDLRYADHLGDYVSDAYYDAERAAAEDDLKRLHAIDRASLDATDQIAYDVFEWQTQETLKNLTPEMLALTAVRPIDHFTGFHTFYPSFASGQGAAPFKTLADYENNLKRHKEYVALLDRSIERFRQGMASGVVQSKMTVRNMIDQLDEIIALGVEGSTFYGPVKKFPEGISAADQARLKTAYAAAIRDELIPAHIRLRDFLKNEYLPVAREAVGISAMKGGDKVYLAAIEQLTTLPLTPDYVHQLGLSEVARIRSQMEAIKTQVGFKGTLAEFFHHLRTDPKFKPKSKQQLVDGYYAIGKRVDARIPEQFSTIPKTPLEIRYYEPYREKTQAGGSYEPGMYDPKDPSKNRPGIFYFNTYDLPSRTTPGMETLYLHEGAPGHHFQISLAQENDRLPAFMRYGGNTAYAEGWGLYAETLWKELGMETDPYERFGGLDDEMLRAMRLVVDSGIHAKGWTREQAIKYMLDNSGMGETDATAEVERYIAWPGQALAYKIGQLTMSRLKAKAQAELGARFDPREFHAQILMTGALPMTVLEKKIDGWIASVKAAN
>NC_020561.1|WP_015458468.1|1800586_1800805_-|hypothetical-protein
MRDRPGRWRTVRAVLQPAGQGAVGAEPVPAYLLACDIQTAPIEREAISIAEAVRWASAQPWPVDLYLHDDGG

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_020561_5

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_020561_5

2786536-2786630

Orphan

Consensus_repeat	Method
GCCGCCGGCGCGCTGCTGGGCCG	CRISPRCasFinder

1 spacers

The CRISPR arrays of NC_020561_5

>merge|NC_020561|5|2786536-2786630|CRISPRCasFinder
GCCGCCGGCGCGCTGCTGGGCCGGACAGTGGACACGAGCGGCGATCGCATGCTGGGCACGCTGCTGGGCGGTGCCGGCGGCGCGCTGCTGGGCCG

>NC_020561|5|4|2786536-2786630|CRISPRCasFinder
GCCGCCGGCGCGCTGCTGGGCCG	GACAGTGGACACGAGCGGCGATCGCATGCTGGGCACGCTGCTGGGCGGT
GCCGGCGGCGCGCTGCTGGGCCG

Protein	Signature genes	Signature genes Name	Protein_function
NC_020561.1\|WP_015459346.1\|2794484_2796158_+\|acyl--CoA-ligase	unknown	unknown	gnl\|CDD\|223395
NC_020561.1\|WP_015459337.1\|2784885_2786157_+\|CoA-transferase	unknown	unknown	gnl\|CDD\|367110
NC_020561.1\|WP_144062053.1\|2778064_2779378_+\|efflux-RND-transporter-periplasmic-adaptor-subunit	unknown	unknown	gnl\|CDD\|273776
NC_020561.1\|WP_144061970.1\|2773204_2773965_+\|IS5-family-transposase	unknown	unknown	gnl\|CDD\|379129
NC_020561.1\|WP_015459329.1\|2771215_2773117_+\|ribonucleoside-diphosphate-reductase-subunit-alpha	unknown	unknown	gnl\|CDD\|236378
NC_020561.1\|WP_015459331.1\|2775277_2776480_+\|ABC-transporter-permease	unknown	unknown	gnl\|CDD\|223650
NC_020561.1\|WP_051128741.1\|2774609_2775281_+\|ABC-transporter-ATP-binding-protein	unknown	unknown	gnl\|CDD\|213222
NC_020561.1\|WP_015459336.1\|2783835_2784795_+\|1-phosphofructokinase-family-hexose-kinase	unknown	unknown	gnl\|CDD\|238570
NC_020561.1\|WP_015459342.1\|2789095_2791591_+\|FtsX-like-permease-family-protein	unknown	unknown	gnl\|CDD\|225669
NC_020561.1\|WP_015459343.1\|2791607_2792387_-\|peptidoglycan-editing-factor-PgeF	unknown	unknown	gnl\|CDD\|224413
NC_020561.1\|WP_144062052.1\|2776637_2778089_+\|TolC-family-protein	unknown	unknown	gnl\|CDD\|224455
NC_020561.1\|WP_015459344.1\|2792445_2793504_-\|SAM-dependent-methyltransferase	unknown	unknown	gnl\|CDD\|224481
NC_020561.1\|WP_015459347.1\|2796233_2798450_+\|xanthine-dehydrogenase-family-protein-molybdopterin-binding-subunit	unknown	unknown	gnl\|CDD\|224446
NC_020561.1\|WP_144062054.1\|2779509_2780052_-\|hypothetical-protein	unknown	unknown	unknown
NC_020561.1\|WP_144062055.1\|2786713_2787616_-\|hypothetical-protein	unknown	unknown	unknown
NC_020561.1\|WP_015459348.1\|2798446_2799454_+\|ferrochelatase	unknown	unknown	gnl\|CDD\|234585
NC_020561.1\|WP_084673659.1\|2780327_2783564_-\|TonB-dependent-receptor	unknown	unknown	gnl\|CDD\|224544
NC_020561.1\|WP_015459345.1\|2793520_2794387_-\|prolipoprotein-diacylglyceryl-transferase	unknown	unknown	gnl\|CDD\|234599
NC_020561.1\|WP_041865409.1\|2787733_2788327_-\|arylesterase	unknown	unknown	gnl\|CDD\|238860
NC_020561.1\|WP_015459341.1\|2788406_2789099_+\|ABC-transporter-ATP-binding-protein	unknown	unknown	gnl\|CDD\|226647

Protein	Function_ID	Function_description	E-value
NC_020561.1\|WP_015459346.1\|2794484_2796158_+\|acyl--CoA-ligase	gnl\|CDD\|223395	COG0318, CaiC, Acyl-CoA synthetases (AMP-forming)/AMP-acid ligases II [Lipid metabolism / Secondary metabolites biosynthesis, transport, and catabolism].	6.19042e-134
NC_020561.1\|WP_015459337.1\|2784885_2786157_+\|CoA-transferase	gnl\|CDD\|367110	pfam02515, CoA_transf_3, CoA-transferase family III. CoA-transferases are found in organisms from all lines of descent. Most of these enzymes belong to two well-known enzyme families, but recent work on unusual biochemical pathways of anaerobic bacteria has revealed the existence of a third family of CoA-transferases. The members of this enzyme family differ in sequence and reaction mechanism from CoA-transferases of the other families. Currently known enzymes of the new family are a formyl-CoA: oxalate CoA-transferase, a succinyl-CoA: (R)-benzylsuccinate CoA-transferase, an (E)-cinnamoyl-CoA: (R)-phenyllactate CoA-transferase, and a butyrobetainyl-CoA: (R)-carnitine CoA-transferase. In addition, a large number of proteins of unknown or differently annotated function from Bacteria, Archaea and Eukarya apparently belong to this enzyme family. Properties and reaction mechanisms of the CoA-transferases of family III are described and compared to those of the previously known CoA-transferases.	4.31965e-170
NC_020561.1\|WP_144062053.1\|2778064_2779378_+\|efflux-RND-transporter-periplasmic-adaptor-subunit	gnl\|CDD\|273776	TIGR01730, COG0845:_Membrane-fusion_protein, RND family efflux transporter, MFP subunit. This model represents the MFP (membrane fusion protein) component of the RND family of transporters. RND refers to Resistance, Nodulation, and cell Division. It is, in part, a subfamily of pfam00529 (Pfam release 7.5) but hits substantial numbers of proteins missed by that model. The related HlyD secretion protein, for which pfam00529 is named, is outside the scope of this model. Attributed functions imply outward transport. These functions include nodulation, acriflavin resistance, heavy metal efflux, and multidrug resistance proteins. Most members of this family are found in Gram-negative bacteria. The proposed function of MFP proteins is to bring the inner and outer membranes together and enable transport to the outside of the outer membrane. Note, however, that a few members of this family are found in Gram-positive bacteria, where there is no outer membrane. [Transport and binding proteins, Unknown substrate].	4.71784e-20
NC_020561.1\|WP_144061970.1\|2773204_2773965_+\|IS5-family-transposase	gnl\|CDD\|379129	pfam13340, DUF4096, Putative transposase of IS4/5 family (DUF4096).	9.54417e-28
NC_020561.1\|WP_015459329.1\|2771215_2773117_+\|ribonucleoside-diphosphate-reductase-subunit-alpha	gnl\|CDD\|236378	PRK09102, PRK09102, ribonucleoside-diphosphate reductase subunit alpha.	0
NC_020561.1\|WP_015459331.1\|2775277_2776480_+\|ABC-transporter-permease	gnl\|CDD\|223650	COG0577, SalY, ABC-type antimicrobial peptide transport system, permease component [Defense mechanisms].	2.06104e-32
NC_020561.1\|WP_051128741.1\|2774609_2775281_+\|ABC-transporter-ATP-binding-protein	gnl\|CDD\|213222	cd03255, ABC_MJ0796_LolCDE_FtsE, ATP-binding cassette domain of the transporters involved in export of lipoprotein and macrolide, and cell division protein. This family is comprised of MJ0796 ATP-binding cassette, macrolide-specific ABC-type efflux carrier (MacAB), and proteins involved in cell division (FtsE), and release of lipoproteins from the cytoplasmic membrane (LolCDE). They are clustered together phylogenetically. MacAB is an exporter that confers resistance to macrolides, while the LolCDE system is not a transporter at all. An FtsE null mutants showed filamentous growth and appeared viable on high salt medium only, indicating a role for FtsE in cell division and/or salt transport. The LolCDE complex catalyzes the release of lipoproteins from the cytoplasmic membrane prior to their targeting to the outer membrane.	8.89437e-107
NC_020561.1\|WP_015459336.1\|2783835_2784795_+\|1-phosphofructokinase-family-hexose-kinase	gnl\|CDD\|238570	cd01164, FruK_PfkB_like, 1-phosphofructokinase (FruK), minor 6-phosphofructokinase (pfkB) and related sugar kinases. FruK plays an important role in the predominant pathway for fructose utilisation.This group also contains tagatose-6-phophate kinase, an enzyme of the tagatose 6-phosphate pathway, which responsible for breakdown of the galactose moiety during lactose metabolism by bacteria such as L. lactis.	2.52122e-95
NC_020561.1\|WP_015459343.1\|2791607_2792387_-\|peptidoglycan-editing-factor-PgeF	gnl\|CDD\|224413	COG1496, yfiH, Multicopper polyphenol oxidase (laccase) [Secondary metabolites biosynthesis, transport and catabolism].	4.55619e-80
NC_020561.1\|WP_144062052.1\|2776637_2778089_+\|TolC-family-protein	gnl\|CDD\|224455	COG1538, TolC, Outer membrane protein [Cell envelope biogenesis, outer membrane / Intracellular trafficking and secretion].	1.00324e-40
NC_020561.1\|WP_015459344.1\|2792445_2793504_-\|SAM-dependent-methyltransferase	gnl\|CDD\|224481	COG1565, COG1565, Uncharacterized conserved protein [Function unknown].	4.64276e-98
NC_020561.1\|WP_015459347.1\|2796233_2798450_+\|xanthine-dehydrogenase-family-protein-molybdopterin-binding-subunit	gnl\|CDD\|224446	COG1529, CoxL, Aerobic-type carbon monoxide dehydrogenase, large subunit CoxL/CutL homologs [Energy production and conversion].	8.0261e-57
NC_020561.1\|WP_015459342.1\|2789095_2791591_+\|FtsX-like-permease-family-protein	gnl\|CDD\|225669	COG3127, COG3127, Predicted ABC-type transport system involved in lysophospholipase L1 biosynthesis, permease component [Secondary metabolites biosynthesis, transport, and catabolism].	0
NC_020561.1\|WP_015459348.1\|2798446_2799454_+\|ferrochelatase	gnl\|CDD\|234585	PRK00035, hemH, ferrochelatase; Reviewed.	1.22445e-150
NC_020561.1\|WP_084673659.1\|2780327_2783564_-\|TonB-dependent-receptor	gnl\|CDD\|224544	COG1629, CirA, Outer membrane receptor proteins, mostly Fe transport [Inorganic ion transport and metabolism].	2.51866e-18
NC_020561.1\|WP_015459345.1\|2793520_2794387_-\|prolipoprotein-diacylglyceryl-transferase	gnl\|CDD\|234599	PRK00052, PRK00052, prolipoprotein diacylglyceryl transferase; Reviewed.	3.13931e-103
NC_020561.1\|WP_041865409.1\|2787733_2788327_-\|arylesterase	gnl\|CDD\|238860	cd01822, Lysophospholipase_L1_like, Lysophospholipase L1-like subgroup of SGNH-hydrolases. The best characterized member in this family is TesA, an E. coli periplasmic protein with thioesterase, esterase, arylesterase, protease and lysophospholipase activity.	1.08763e-81
NC_020561.1\|WP_015459341.1\|2788406_2789099_+\|ABC-transporter-ATP-binding-protein	gnl\|CDD\|226647	COG4181, COG4181, Predicted ABC-type transport system involved in lysophospholipase L1 biosynthesis, ATPase component [Secondary metabolites biosynthesis, transport, and catabolism].	5.08236e-102

>NC_020561.1|WP_015459337.1|2784885_2786157_+|CoA-transferase
MEAGATGAKPQVLAGVKVLDLSRVLAGPWCTQILADFGADVIKVEMPGRGDDTRGWGPPFLDPAPDEPGPGESAYYLSCNRNKRSLALDLSTPEGAAIVRRLAAEADILVENFKVGGLARYGLDYQSLRAVNPRLVYCSITGFGQDGPYADQAGYDFVAQAMGGLMSITGEPDGPPTKVGVAITDITTGIYATVSILVALRHAESTGQGQHIDCSLLDTQISMLANQAMSWLVGGVVPGRLGNAHPTIVPYRLFDAADGSVVVAVGNDGQFRSLCAALGRPDLGTDDRFARNAARVANRDVLEPVLEGLIATRSAAEVIAMLKENGIPGGPVNRIDQIFGDPFVAARGSVHNFVREDGVAVPTVAYPARLSETPADYRRRAPYLGEHSSEILGEWLGIGTSELAGLRGDGVIRDRPGPDGEVP
>NC_020561.1|WP_015459336.1|2783835_2784795_+|1-phosphofructokinase-family-hexose-kinase
MRRIATLTLNPAIDGACEAERVFPTHKIRTNNERYDPGGGGINVARVVARLGGEAEAYYLAGGVTGAVLDSLIDKAGIARTRIDIHDHTRVSLAVHERASGQEFRFVPEGPLVGDAEWQAALDRLTVAECDYLVVSGSLPRGVPDDFYARTRAAMAPRGVKLVVDTSGAALARTLVDGGIFLMKPSQGELEQLIGRKLADVAAIAEAASAFVAGGQVEHVAVTMGHRGAVLVNAGGAFLLPAVPVEARSAVGAGDSFVGAMTLGFARGWSAAEAFRYGLAAGTAAVLTPGTDLCCREDVERILASVPEPEALTIGASAG
>NC_020561.1|WP_084673659.1|2780327_2783564_-|TonB-dependent-receptor
MKRSFLRGYLYSATAFASIATACAVPASAQTSEQLYDFNIPSQSLGGALNAFARASHQQITFDPAAVREKQSPALTGQYSARDALDRLLANSGLTVRVGRTGIFIVEKPATPRPSKAEAQNPDLTPAETLDIVVTAQKREEKILDVPIAVSAFSGTQLDRQKIESGADLVRGVPNLNFSKSFSSMYNIGIRGIGTKALNSSSDPGVAVSYNNTPLIRNRLFEQEFFDTSRLEVLRGPQGTLYGRNATGGVVNIFPALPTGEFEGELKGEVGNYETRRVSGMLNIPLTDTFSIRGAGAYTKREGFDYNEFTRNRVNGRDLWSTRLSAQWEPSDRFKANVIWEHFNEDDDRSRTGKALCTTDPGPEMVGSTIVPDRLRSRLSQGCLPGSLYDDAAFGVPNAASQTALYNAQSIVIGIDPNTFASIPLVKAGDPYAGIVQSRNPRRISTAIDLTFKAKNDIVQLNLELKIGESLTLISQSGYSKDRWYSSQDYNRFASNPIFGNTKGLYNVLFEPYADDGPLPDGFYTDSQLGSSDRLLTMDLNRTRTRQWTQEIRLQSDFNNRFNFNVGANYLNFKTTDDYYAFSNLFNLTTDFVYLQDLSKAFGSPPTISFLNCPAASEDPACQYAPYKDKNPLNSIDDLGHNYFLSRNNVKTKSFAIFGEAYYQATDDIKITLGARYTNDKKYQTQIPSQLLLSSSIITGGTVNYGYPALPDIDQGWSRFTGRAVVDWKPNISFTDDTLVYGSVSRGYKGGGANPPRVDFDPRIVQYIPLSDRYKPEGLTAFEIGTKNLLANNTISLNATAFFYDYDNYQISQVTDRITYTENFDAQTWGLELEATWQPNRNFRFNSSLGYLDSKLKKNAKSIDVMDRTQGNPDWTVVRPWLQVPTNCVAPTKYVEKVLSTFPSELALAALCPGSTGIGSYNPNIPPETTVPYWQYLGFTYDPLTEAPNAGRGFDADLGGNELPNSPHLTFNVGAQYTFFLDSDDWELTFRGDYYRQSKSYARVYNTEFDKLKGWGNLNISVSFARPKDQLAFQLYVKNVLNDQPITDVFLSADDIGMPANTFYLDPRIIGFNITKKF
>NC_020561.1|WP_144062054.1|2779509_2780052_-|hypothetical-protein
MKKLSLICSAALIMAGMSSAANAVTIRKAGNSMVLSGPITTTILGVSTTCTVTAVYDVPEMAGDGHTTFSHSLSTDPSHGHTVNLRSFSMSGGTGCSLATLHGTPTISVSPTTVTISGINATAIGGLITCAGSISGTYTHPGSPPPPNARVTFLNQTVGACTFSGTLTAAAGEFDIDATP
>NC_020561.1|WP_144062053.1|2778064_2779378_+|efflux-RND-transporter-periplasmic-adaptor-subunit
MAHIPERLKRMDRRSLGWLVVAAGGLFVLALWWRSPGQPEAGGETTEQTMVVQPRPFTASISFAGTIKAGEGTGIVAPFDGTVKEMGFAYGNPVAPGQMLAVLDVSELEQSRNEAESAYLKAMQAARDMEGWASGPEVSRARRAVESARFDLADTERKLAETKTLLDRGLVARTEYDGMLQQLRTQRTAVASANEDMRVALERGSGPNRRVAMLELANARARLAVLNAQFTGAVIRAKDAGIMVRPPANKLAVAAENDVHVGARVSRGQLIGVNARAGDLIVTFNIEEADVALLRLGQRLMVTGAGFMGLALPGKIDAIAGEASNPGGVTTPGKAIFTATASLDPLAPDQAARVRVGMTANIAVMTYNAAAALVVPPSAVRGAAPDTFILVRNQRTGKDSPAKVQIGQVGPDGVEIVSGLKPGDTIVWEDAQSFPSQ
>NC_020561.1|WP_144062052.1|2776637_2778089_+|TolC-family-protein
MLIACLCGAIAPDLASAQKIAPIAAVRSPPANPVPSGQPVPLTLAETVALGLRDNRTIKSAYLQRVAQKFDLFVADTLFLPKLNLSADIAHQRVGGTTFNTSSVGAAGTWLTPIGTRVQFSWDRRDQLDSGRTGHSDTAALSFTQPLLRGAGTKVNMAPVRIARLQEEINKLSLKSTVIDTVTGIIQAYRRLSQAQSQVELAELSLERTRDLLETNRALIAAGRMAAADIVQTESGVANQEVAVLQARQQLASAQLALLQLLAVDPRTNVVAADEPDAEQADIDLDRVVDLGLSSRVDILGQRLALEQTRIDLAVARNNRLWDLSIGGSVSRQRVDDPILGRLDPPTDHNVGVQLSIPIGDFSYRQREIGATTSLRTAELRYQDLTQSVETQIRDAVQTVEASWQQLAAARRARALAARALELQQEKLKVGRASNFEVLSFQADLRTADTQELTARIGYLNALTSLDQQIGNTLETWRISLND
>NC_020561.1|WP_015459331.1|2775277_2776480_+|ABC-transporter-permease
MTQRAPATSGIPLAEIIGEAFANLRVQGRRSALALLGILIGTASIVALLNIGHIAQLETLKLFRHLGVDTVQLQATPTGEMPPGFDPDVVAQLPARDPDVLRAVPIITGRASISAGRQTTDAGIVGMPPAFAATVGLAPRLGRLFRPIDNCSPVALVGKGTAEKLSAPGAELLPGAAIIVGNYGFTVIGILMPTALEAINPSDYNESVIVPLACSRRVVAGGVPNIVLAKLRPTADPDIVGQRLSAMLANPRSAIQVISARTYIKTMNAQKAVHSRMLAAVGAISLLVGGIGVMNVMLMGVMERRREIGLRAAIGATPRDLRTMFIVESATLAVAGGLFGALLGLLATYFVARSSGWTFSIAYYVLPLGTGVAGLVGLIFGLYPAITASRLKPIEALRAE
>NC_020561.1|WP_051128741.1|2774609_2775281_+|ABC-transporter-ATP-binding-protein
MKEVEKAYGVAANPIPVLKGISFSIENGSFCAILGPSGSGKSTLLNIIGLLDHPDRGEVLLGDNAVNFASAEETARLRNRLLGFVFQSFQLLPRLRAWENVALPLLYRGIPKADRRPKALALLDRVGLGHRADHLPSELSGGQCQRVALARALIGDPQLILADEPTGSLDSGTSLEMMDLLKDLSRRLAVTIVMVTHDRQLAERCDRRIELLDGQVIADTVAM
>NC_020561.1|WP_144061970.1|2773204_2773965_+|IS5-family-transposase
MARHLFWLSDEAWAAIEPHLPHGRPGKPRVDDRTVISGILHVLKTGCRWRDVPAAYGPPTTIYNRYNRWASRGIWQRLFEKIAGAGPVPDELSIDSTHVKAHRSAAGSKKGEWQEAIGRSRGGRTCKVHCLADDRGRPVAIALTPGNVADISMAVPLLSVTAPARRLIGDKAYDANSLRRWLAERRIKAVIPSTASRRTPYPLNRRIYRRRNVIERLFCRLKNWRRIATRYDRYATNYLAAIALVATIAEWIK
>NC_020561.1|WP_015459329.1|2771215_2773117_+|ribonucleoside-diphosphate-reductase-subunit-alpha
MDLSGSNNEAGASDVATTLEATRAEAGTDSPHGVLKRPYPVEVDHGRDALLTDFGKETLKDRYLLPGESYQDLFVRVASAYADDAAHAQRLYDYISKLWFMPATPVLSNGGTGRGLPISCYLNSVDDSLQAITEIWNENVWLASRGGGIGTYWGNVRGIGEPVGLNGKTSGIIPFVRVMDSLTLAISQGSLRRGSAACYLDISHPEIEEFLEIRKPSGDFNRKALNLHHGVLLTDAFMEAVRDGREWELTSPKDGSVRGKVDARSLFQKLVETRLATGEPYIVFADTVNRAMPKHHRELGLKVSTSNLCSEITLPTGRDHLGNDRTAVCCLSSLNLETWDEWNGDKQFIEDVMRFLDNVLTDYIDRAPPEMARAKYSAMRERSVGLGVMGFHSFLQARGLPFEGAMAKSWNLRMFKHIAAKAQEASMLLASERGACPDAEDRGVMERFSCKMAIAPTASISIICGGTSACIEPIPANIYTHKTLSGSFSIKNVHLQKLLQAKSKDSDAVWNSILEQGGSVQHLDFLNQEEKDTFKTSFEIDQRWLLELAADRTPYIDQATSLNLFIPADVEKWDLLMLHFRAWELGIKSLYYLRSKSIQRAGFAGGVEADNTPDLKKIELATTTDYDECLACQ
>NC_020561.1|WP_144062055.1|2786713_2787616_-|hypothetical-protein
MHDAGAMPFDQWVMLAFPLAGIALTLWLWKTAERRLWWKLAAGFALFLGLLTVALPYADHDRVQARAIAGEVTTVEGPINGHRRWTERSFAGSSRGVGVTTFDRYKETTYEYFYIGDTPFTFIVGGYPSHASFTNAADPPVAIADGMWARAKFFRDDWYNDERRITWLELAPAPPAGARPIFPASVPRAPPAKAGSNLPPDFAAFWEGFAAAVGRGDAAAVRPLVAFPFHFDSHELGADEFGSLWMSLFAAPLRPCIAAAAPVREGDRYVIFCAGYGYYFAKTASGWKLAEFLADGEAMQ
>NC_020561.1|WP_041865409.1|2787733_2788327_-|arylesterase
MTLFVTFPALAADKLVVAFGDSLMAGYQLKPGEGFAPRLEAALRRSGIPARVHNAGVSGDTTAQGTARLGWVLGGLKARPDLVIVELGANDMLRGLPNAQTRANLDAILAELKRRRIPAMVAGMQAAPNLGQAYAREFNAIHPALARKYQVPLYPFFLQGVATNKALLLKDGMHPNPRGVDVIVANILPSVRKALGR
>NC_020561.1|WP_015459341.1|2788406_2789099_+|ABC-transporter-ATP-binding-protein
MSAANIVIEARNVTLALGRGEARVEILRGIDLSIAEGETVALLGPSGSGKSSLMAVLSGLERADAGQVHVAGADFAAMDEDRLARARRGRIGIILQAFHLLPTMTALENVAVPLELAGQADAFARARVELEAVGLGHRTGHYPAQLSGGEQQRVAIARAVAPRPAILFADEPTGNLDARTGAAIMDLLFGRQRETGETLLVITHDPALAHRCGRVIEMLDGRIVSDSRAA
>NC_020561.1|WP_015459342.1|2789095_2791591_+|FtsX-like-permease-family-protein
MKLAWALALRDLRGGFAGLRLLAICLFLGVMALAGVGSLSSAITSELALQGQSILGGDVQMSIVQRTADPGERAAFAAAGRVSETIRMRAMASRPDGAQAVLAELKGVDGAYPLYGDFRLAPGALGARPRGKEVAIAPALADRLAVKPGDMVRIGDAELRVIGLIAEEPDRVGEGFTFGPAALVDMDGLAATGLVQPGSLYTSRYRIRLPDGQDAANVAKQIADRFPGAGWEVQDRSNAAPGTRRFIGRLGQFLMLVGLTALAVAGIGVGNGVTSYLEGKRNAIATLKVLGASSRTIFLSYLIQIGLVAGAGILAGVVAGSLVPSAVVALAGDALPVQPHFAIHARPLLLAALYGLLIALLFVLAPLARARAVTAASLFRGGVETARRPAFPVLAAMAITLAAIVALAVGTAREPLFAAWFVAAVAGLLLLLTLIGWAVRRIAARLPRPRRPLLRLAIANLHRPGAQTGRLVVALGLGLTLFATLAVIETNLSGQIDSTVPAKAPSFFALDIPVDDIDRFRALVAARAPGAEVRTVPSLRGPVVSFGGKRVADLDTLPEGAWILRGDRGLTYSATPPEGSRVVEGQWWPPDYSGPPLVSLDVEAARILGLKVGDEITVSVLGVEVPATIASLREIKWDTMGFNFVLVYSPGVLEGAPHSYMATIAMPEKGEAALNREITRQFPSVSLIRVKEVIGQVADVLGQLSTAVRSAASVALAAGIAVLVGAIAASRRSRIYDSVLLKLLGATRRQVLAAQAIEYAILASILSLLAALFGALAGWYVVTGVFELDWAPDWMVVGATLAIGGFGTLALGLLGSLPALAARPARALREL
>NC_020561.1|WP_015459343.1|2791607_2792387_-|peptidoglycan-editing-factor-PgeF
MTQAIDPIRAASLGDIPHAFLGRRGGVSMGIHAGLNVGLGSDDDRDAIRENRRRAVAAVLPDAQLVTLHQVHSADAVKVGAPFPDDARPHADALVTDRPGLLLGILTADCVPVLFADSKAGVIGAAHAGWKGAIGGVTDATIAAMEAIGADRGRIVAAIGPCIARASYEVDEAFLRRFAEDDAENERFFTDGVRARHYQFDIEAYVTARIAAAGIGRVEALGLDTYADPDRFYSFRRATHRGEPGYGRQISLIGLPPHA
>NC_020561.1|WP_015459344.1|2792445_2793504_-|SAM-dependent-methyltransferase
MTSPSCEERLARLIRAVGPIPIAQFMAEANGAYYASRDPLGAAGDFVTAPEISQMFGELIGLWLADLWQQAGEEPACYVELGPGRGTLAADATRAMRAVGLQPAVHFVETSPALRAAQAERFANAAWHDDLSTLPAGKPLLLVANEFFDALPIRQFVRTVNGWRERMVAHGPDGFVPVPGEVPVDALVPDRLRDAPAGSILESAPMGTAIARDVAGRIAEQGGAAIIIDYGYAGRAAGDTFQAVHAHAYADPFARPGTRDLTAHVDFSAIRQAGEAEGVRVHGPVGQGAWLEAIGIGARTAALSRGSPTRAEEIEAARHRLTDASEMGELFKVMAFVAPGWPEPAGFGAPPA
>NC_020561.1|WP_015459345.1|2793520_2794387_-|prolipoprotein-diacylglyceryl-transferase
MILTFLADATAALRFDQLGLSPVALDLGFFQLRWYSLAYIAGILIGWWYLLKLLDQPGAPMARRHADDMVFYATLGILIGGRLAYVTFYQPEIWQHPLDVLKLWEGGMSFHGGVIGVSLGIILLARKYQLNWLRIHDYVACCVPFGLFFGRLANFVNGELWGRAADVPWAMIFPRGGDVARHPSQLYEAGLEGILLFAVLWFLFWKTDARYQPGKLVGTFLLGYGLSRFCVEYFREPDAQLMEFAARTHLSMGQWLTVPMILGGLYLILTARGRRQRVEPVAGDQSVA
>NC_020561.1|WP_015459346.1|2794484_2796158_+|acyl--CoA-ligase
MQAVMDAVTGPGGLVEITHDARGFAMAAKLPATLPDLFRFACGQYGPETALVAGKERLTYADLDMWSERLARSLAGGHGIRKGDRVAIAMRNAPAWIVAYMAAAKAGAIVTLINGWWTPEELAHSLQLSTPSLVIADGPRAQRIADTGIEVRVADLLIDLPIAQALAPLIDGVAEGDLPAVSPEDDATLLFTSGSTGQCKGAVSTHHAVTTATYCFVALTATLLGAFYGGDRNNLPGAPAALVTVPLFHVTGEIPVFVASIVIARKLVLMPKWDATEALRLIEAEKVSYFVGVPTMSLELMQHPDRGRYDLSTLLDIAAGGAPRPAAHVPRLMEAFPQSNPMMGYGLTETNAVGCTNCRGNYAAKPSSTGPAQAPFVHVAIYDDDGNALPPGERGMIGIASAANIRGYWNNPEATAAAFTADGHFLTGDVGYLDEDGYLFIVDRAKDIVIRGGENISCIEVEAALYAYPDVAEASVFGLPDERLGEIVGAVVRMRRGGAVDAVTLLEFLGGHLARFKLPAHLWFSDDPLPRLGTGKIDKRALRERFTRQMEADARAA
>NC_020561.1|WP_015459347.1|2796233_2798450_+|xanthine-dehydrogenase-family-protein-molybdopterin-binding-subunit
MAISRRNFLVGGGAGAGLLLAWGLWPRSYRPNLVASPGEAIFNAFLKIGEDGHVAVVVPQAEMGQGVWTSLPQVLADELGADWRTIAVEPAPISPLYANDFLIGEAAQGMLPDLLKGVGGWAARQYAIRSALMVTGGSSSIRGFETRFREAGAVARALLCTAAAKRWDADWRACDTAVGFVTRGEDRLRFGELAAEAASLDAPGGVALRAPGAGGLSGRSVPRIDLPSKVDGSARYAGDVRLPDMVFAAVRHGPHGATRLTGVDKAAAEKVPGVIAVVQNPGWAGAVATNGWAAERALDAMRPRFTTDGPFPDSDSIDQALNAALDGGEATRFVAVGDVDAAFVGKQGLKVDYSVPLAVHAAMEPLAATARLIGDRMEVWMPTQAPGLARAAVARALDMSEGQVTIYPMLVGGGFGRKIENDAAVQAAIIAREVRRPVQLTWSRRDDIQQDRFRPAARARMAAALGERGEVVGWQARIAAPAAMASMQSRLMAGGGDPGAKAELSAVEGALPPYAIPAIAIDHLPVDIGIPTGIWRSVANSYTAFFTECFIDELARSAGIEPLSFRMQMLGGNPRLAHCLTTVTAMGGWDGGMPGGNQGLACHSSFGSHVAMLVEAHVGEDQRIVVDRVAAAVDCGRIIHPDIVLQQIEGGIVWGLAAAFGATTGFARGMAEARNFDALNLPLLAGTPDIRVELIPSKEAPGGVGEIAVPPVAPAVANAIFAATGQRLRSLPLAIGGQ
>NC_020561.1|WP_015459348.1|2798446_2799454_+|ferrochelatase
MNPPADHPAVPQRRIGVLLVNLGTPDAPDASSVRRYLRDFLSDPRVVEIPRLIWQPILHGLILPTRPKKSAHAYAQVWRPDGSPLAAITRAQAAALAGAFGPDVIVDHAMRYGRPAIGDRIRALVAAGCDRILLAPLYPQYSAATTATANDRAFATLAAMRFQPAIRTLPPYFDHPDHIAALKAGIEGALAALDFVPEAIVASFHGMPERTLRLGDPYHCQCQKTARLLGEALGRELIVTFQSRFGRAKWLEPSTDVTLAALPGRGIRKVAIVAPGFAADCLETLEELAIRGRDGFLAAGGEKFAYLPCLNDSGAGIEMLKKLLGAELEGWRAGL

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NC_020561_6

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_020561_6

3573522-3573620

Orphan

Consensus_repeat	Method
CCGCCGGCCTTCCGTTTCAGCCGCGC	CRISPRCasFinder

1 spacers

The CRISPR arrays of NC_020561_6

>merge|NC_020561|6|3573522-3573620|CRISPRCasFinder
CCGCCGGCCTTCCGTTTCAGCCGCGCCGGGGTGGCCGCGGAATAAGGGATGGAAAGGGCCGGCGGCGGTTCGGCCGCCGGCCTTCCGTTTCAGCCGCGC

>NC_020561|6|5|3573522-3573620|CRISPRCasFinder
CCGCCGGCCTTCCGTTTCAGCCGCGC	CGGGGTGGCCGCGGAATAAGGGATGGAAAGGGCCGGCGGCGGTTCGG
CCGCCGGCCTTCCGTTTCAGCCGCGC

Protein	Signature genes	Signature genes Name	Protein_function
NC_020561.1\|WP_187294010.1\|3566354_3567074_-\|ATP-binding-cassette-domain-containing-protein	unknown	unknown	gnl\|CDD\|213226
NC_020561.1\|WP_015460060.1\|3582317_3583745_-\|DEAD/DEAH-box-helicase	unknown	unknown	gnl\|CDD\|223587
NC_020561.1\|WP_015460047.1\|3569287_3569992_-\|2OG-Fe(II)-oxygenase	unknown	unknown	gnl\|CDD\|378278
NC_020561.1\|WP_015460057.1\|3578653_3579418_-\|response-regulator-transcription-factor	unknown	unknown	gnl\|CDD\|225818
NC_020561.1\|WP_015460042.1\|3565688_3566102_-\|nucleoside-diphosphate-kinase-regulator	unknown	unknown	gnl\|CDD\|180236
NC_020561.1\|WP_015460062.1\|3584408_3585857_+\|FAD-binding-oxidoreductase	unknown	unknown	gnl\|CDD\|223354
NC_020561.1\|WP_015460054.1\|3575276_3575717_-\|DUF2834-domain-containing-protein	unknown	unknown	gnl\|CDD\|371414
NC_020561.1\|WP_015460049.1\|3571365_3571770_+\|DUF805-domain-containing-protein	unknown	unknown	gnl\|CDD\|377540
NC_020561.1\|WP_015460050.1\|3572071_3572335_+\|hypothetical-protein	unknown	unknown	unknown
NC_020561.1\|WP_015460051.1\|3572440_3573493_+\|ribonucleotide-diphosphate-reductase-subunit-beta	unknown	unknown	gnl\|CDD\|236591
NC_020561.1\|WP_051128854.1\|3574603_3575254_+\|glutathione-S-transferase-family-protein	unknown	unknown	gnl\|CDD\|239344
NC_020561.1\|WP_015460055.1\|3576026_3578162_-\|NAD-dependent-DNA-ligase-LigA	unknown	unknown	gnl\|CDD\|236137
NC_020561.1\|WP_015460044.1\|3567066_3567735_-\|molybdate-ABC-transporter-permease-subunit	unknown	unknown	gnl\|CDD\|226629
NC_020561.1\|WP_015460061.1\|3583856_3584303_-\|hypothetical-protein	unknown	unknown	unknown
NC_020561.1\|WP_015460063.1\|3585975_3586752_+\|SapC-family-protein	unknown	unknown	gnl\|CDD\|377801
NC_020561.1\|WP_015460045.1\|3567735_3568551_-\|molybdate-ABC-transporter-substrate-binding-protein	unknown	unknown	gnl\|CDD\|270257
NC_020561.1\|WP_015460048.1\|3570056_3571148_-\|DNA-polymerase-IV	unknown	unknown	gnl\|CDD\|235035
NC_020561.1\|WP_015460059.1\|3580918_3582208_+\|L,D-transpeptidase-family-protein	unknown	unknown	gnl\|CDD\|225536
NC_020561.1\|WP_041865516.1\|3568635_3569283_-\|DNA-oxidative-demethylase-AlkB	unknown	unknown	gnl\|CDD\|237957
NC_020561.1\|WP_015460058.1\|3579490_3580687_-\|histidine-kinase	unknown	unknown	gnl\|CDD\|225814

Protein	Function_ID	Function_description	E-value
NC_020561.1\|WP_187294010.1\|3566354_3567074_-\|ATP-binding-cassette-domain-containing-protein	gnl\|CDD\|213226	cd03259, ABC_Carb_Solutes_like, ATP-binding cassette domain of the carbohydrate and solute transporters-like. This family is comprised of proteins involved in the transport of apparently unrelated solutes and proteins specific for di- and oligosaccharides and polyols. ABC transporters are a large family of proteins involved in the transport of a wide variety of different compounds, like sugars, ions, peptides and more complex organic molecules. The nucleotide-binding domain shows the highest similarity between all members of the family. ABC transporters are a subset of nucleotide hydrolases that contain a signature motif, Q-loop, and H-loop/switch region, in addition to, the Walker A motif/P-loop and Walker B motif commonly found in a number of ATP- and GTP-binding and hydrolyzing proteins.	4.73341e-83
NC_020561.1\|WP_015460060.1\|3582317_3583745_-\|DEAD/DEAH-box-helicase	gnl\|CDD\|223587	COG0513, SrmB, Superfamily II DNA and RNA helicases [DNA replication, recombination, and repair / Transcription / Translation, ribosomal structure and biogenesis].	3.17636e-163
NC_020561.1\|WP_015460047.1\|3569287_3569992_-\|2OG-Fe(II)-oxygenase	gnl\|CDD\|378278	pfam09859, Oxygenase-NA, Oxygenase, catalyzing oxidative methylation of damaged DNA. This family of bacterial sequences is predicted to catalyze oxidative de-methylation of damaged bases in DNA.	2.67268e-121
NC_020561.1\|WP_015460057.1\|3578653_3579418_-\|response-regulator-transcription-factor	gnl\|CDD\|225818	COG3279, LytT, Response regulator of the LytR/AlgR family [Transcription / Signal transduction mechanisms].	1.64699e-43
NC_020561.1\|WP_015460042.1\|3565688_3566102_-\|nucleoside-diphosphate-kinase-regulator	gnl\|CDD\|180236	PRK05753, PRK05753, nucleoside diphosphate kinase regulator; Provisional.	2.34351e-38
NC_020561.1\|WP_015460062.1\|3584408_3585857_+\|FAD-binding-oxidoreductase	gnl\|CDD\|223354	COG0277, GlcD, FAD/FMN-containing dehydrogenases [Energy production and conversion].	2.38217e-94
NC_020561.1\|WP_015460054.1\|3575276_3575717_-\|DUF2834-domain-containing-protein	gnl\|CDD\|371414	pfam11196, DUF2834, Protein of unknown function (DUF2834). This is a bacterial family of uncharacterized proteins.	7.04787e-25
NC_020561.1\|WP_015460049.1\|3571365_3571770_+\|DUF805-domain-containing-protein	gnl\|CDD\|377540	pfam05656, DUF805, Protein of unknown function (DUF805). This family consists of several bacterial proteins of unknown function.	2.24429e-30
NC_020561.1\|WP_015460051.1\|3572440_3573493_+\|ribonucleotide-diphosphate-reductase-subunit-beta	gnl\|CDD\|236591	PRK09614, nrdF, ribonucleotide-diphosphate reductase subunit beta; Reviewed.	3.42224e-146
NC_020561.1\|WP_051128854.1\|3574603_3575254_+\|glutathione-S-transferase-family-protein	gnl\|CDD\|239344	cd03046, GST_N_GTT1_like, GST_N family, Saccharomyces cerevisiae GTT1-like subfamily; composed of predominantly uncharacterized proteins with similarity to the S. cerevisiae GST protein, GTT1, and the Schizosaccharomyces pombe GST-III. GSTs are cytosolic dimeric proteins involved in cellular detoxification by catalyzing the conjugation of glutathione (GSH) with a wide range of endogenous and xenobiotic alkylating agents, including carcinogens, therapeutic drugs, environmental toxins and products of oxidative stress. GSTs also show GSH peroxidase activity and are involved in the synthesis of prostaglandins and leukotrienes. The GST fold contains an N-terminal TRX-fold domain and a C-terminal alpha helical domain, with an active site located in a cleft between the two domains. GTT1, a homodimer, exhibits GST activity with standard substrates and associates with the endoplasmic reticulum. Its expression is induced after diauxic shift and remains high throughout the stationary phase. S. pombe GST-III is implicated in the detoxification of various metals.	7.59912e-31
NC_020561.1\|WP_015460055.1\|3576026_3578162_-\|NAD-dependent-DNA-ligase-LigA	gnl\|CDD\|236137	PRK07956, ligA, NAD-dependent DNA ligase LigA; Validated.	0
NC_020561.1\|WP_015460044.1\|3567066_3567735_-\|molybdate-ABC-transporter-permease-subunit	gnl\|CDD\|226629	COG4149, ModC, ABC-type molybdate transport system, permease component [Inorganic ion transport and metabolism].	6.80651e-67
NC_020561.1\|WP_015460063.1\|3585975_3586752_+\|SapC-family-protein	gnl\|CDD\|377801	pfam07277, SapC, SapC. This family contains a number of bacterial SapC proteins approximately 250 residues long. In Campylobacter fetus, SapC forms part of a paracrystalline surface layer (S-layer) that confers serum resistance.	1.74103e-83
NC_020561.1\|WP_015460045.1\|3567735_3568551_-\|molybdate-ABC-transporter-substrate-binding-protein	gnl\|CDD\|270257	cd13539, PBP2_AvModA, Substrate binding domain of ModA/WtpA from Azotobacter vinelandii and its closest homologs;the type 2 periplasmic binding protein fold. This subfamily contains domains found in ModA proteins that serve as initial receptors in the ABC transport of molybdate in eubacteria and archaea. Bacteria and archaea import molybdenum and tungsten from the environment in the form of the oxyanions molybdate (MoO(4) (2-)) and tungstate (WO(4) (2-)). After binding molybdate with high affinity, they interact with a cognate membrane transport complex comprised of two integral membrane domains and two cytoplasmically located ATPase. This interaction triggers the ligand translocation across the cytoplasmic membrane energized by ATP hydrolysis. In contrast to the structure of the two ModA homologs from Escherichia coli and Azotobacter vinelandii, where the oxygen atoms are tetrahedrally arranged around the metal center, the structure of Pyrococcus furiosus ModA/WtpA (PfModA) has shown that a binding site for molybdate and tungstate is where the central metal atom is in a hexacoordinate configuration. This octahedral geometry was rather unexpected. The ModA proteins belong to the PBP2 superfamily of periplasmic binding proteins that differ in size and ligand specificity, but have similar tertiary structures consisting of two globular subdomains connected by a flexible hinge. They have been shown to bind their ligand in the cleft between these domains in a manner resembling a Venus flytrap.	1.69706e-86
NC_020561.1\|WP_015460048.1\|3570056_3571148_-\|DNA-polymerase-IV	gnl\|CDD\|235035	PRK02406, PRK02406, DNA polymerase IV; Validated.	0
NC_020561.1\|WP_015460059.1\|3580918_3582208_+\|L,D-transpeptidase-family-protein	gnl\|CDD\|225536	COG2989, COG2989, Uncharacterized protein conserved in bacteria [Function unknown].	1.18106e-63
NC_020561.1\|WP_041865516.1\|3568635_3569283_-\|DNA-oxidative-demethylase-AlkB	gnl\|CDD\|237957	PRK15401, PRK15401, DNA oxidative demethylase AlkB.	1.24373e-135
NC_020561.1\|WP_015460058.1\|3579490_3580687_-\|histidine-kinase	gnl\|CDD\|225814	COG3275, LytS, Putative regulator of cell autolysis [Signal transduction mechanisms].	8.51321e-48

>NC_020561.1|WP_015460051.1|3572440_3573493_+|ribonucleotide-diphosphate-reductase-subunit-beta
MPLLQASRTYKPFEYPWAFEYWKRQQQLHWLPEEVPLGEDCRDWAQKLDQSERNLLTQIFRFFTQADVEVQDCYHDKYGRVFKPTEIKMMLTAFSNMETVHIAAYSHLLDTIGMPETEYSAFLQYKEMKDKHDYLSQFGVDTDEDIARTLAMFGGFTEGLQLFASFAMLMNFPRFNKMKGMGQIVSWSVRDESLHCDGIIRLFHAFVKERNCLTPAVRDDILDQCQKTVRLEDAFIDLVFEMGPVPGMTPKDIKKYVRYIADWRLGQLGFKPIYMIDEHPLPWLAPLLNGVEHANFFETRATEYSKAATRGNWGEVWDAFDRRKAAHNGPAANEDAGGEDMFSRAGVAAE
>NC_020561.1|WP_015460050.1|3572071_3572335_+|hypothetical-protein
MTAPGWTLIVPIAVFNIVIGLWTLRDAARHNHYIKSRIGANDPLFEEHSRHPDFPGLKEVSSARAKGIILLLSGVVLLMLLYLPWAG
>NC_020561.1|WP_015460049.1|3571365_3571770_+|DUF805-domain-containing-protein
MEWMLLPLKRYADFNGRSSRREFWMFAALHALVALLFYVPLSGIFFRGMAGVLPATLGVIVPLLGLYVAVMFVPGLAVQVRRFHDLGRPGWMVLIGFVPVVGVFAILYFMCLPGTSGPNRYGADPVAEDVAIRP
>NC_020561.1|WP_015460048.1|3570056_3571148_-|DNA-polymerase-IV
MGQPERPAVTRKIIHIDMDAFYASVEQRDSPELRGRPVAVGGSSARGVVAAASYEARRYGVRSAMPSVTATRKCPELVFVRPRFDVYKAVSRQIREIFAEYSDLVEPLSLDEAYLDVTANRQQLPSATATAEAIRARILAETGLTASAGISYNKFLAKLASDQNKPNGQCVITPAQGEAFVAGLEVGRFHGIGPRTAEKLNRFGIHTGADLRAKDAEWLRRHFGKSGAWYHAIARGIDDRPVTPDRPRKSSGSETTYFEDLATAEAVENGVRAMADEVWGWCERTRAAARTVTVKVKYADFQQITRSRTLPATIDSQAMLHAVSVDLVRTIFPLVKSVRLLGVTLSNFEDEQSAAQAQLAFVL
>NC_020561.1|WP_015460047.1|3569287_3569992_-|2OG-Fe(II)-oxygenase
MTRHRIEAIDRQAIAAGLDGGGWALLPGLLDPAGCADMAGLYDRPAGFRSTVTMARHGFGRGEYRYFAYPLPPLVETLRAAFYRLLAPIANRWQERMGLAARFPEEHRDFLAHCHAAGQARPTPLMLRYGPGDHNCLHQDLYGEHVFPLQAAILLSAPGADFTGGEFVLTEQRPRMQSRVEVVPLAQGDAVVFAVNQRPIAGGRGDYRVTMRHGVSSVRSGRRHMLGIILHDAA
>NC_020561.1|WP_041865516.1|3568635_3569283_-|DNA-oxidative-demethylase-AlkB
MSAGTDLFDAEPRDQALSPGAMVLGGFARDMDRDLLAAIEGVLADAPPRHLVTPGGRRMSVAMSNCGGVGWVSDRRGYRYDPIDPESGRRWPAMPDIFTDLAIRAAAAAGFAGFVPDACLINRYEPGARLSLHQDRDERDRAAPIVSVSLGLPATFLWGGEKRSDRPRRIRIVHGDVTVWGGPARFAFHGVEPVADGAHPLTGRARYNLTFRKVF
>NC_020561.1|WP_015460045.1|3567735_3568551_-|molybdate-ABC-transporter-substrate-binding-protein
MQSFGRRAILALAGAFALAGSLAPAAIAAPADEPAIAAAADLNAALPQIADLFRRKTGRTVKLTFGASGNLTQQILNGAPFQLFLSADESYVARLAEAGRTVDGGTLYATGRIGLFTPRGSPVKADGRLADLAAAIRDGRLRKFAIANPEHAPYGRAAREALTTAKLWDAIQPRLVLGENVAQATQFATSGSADGGIIPLSLAMTPQVQAAGRFALIPAEWHKPLRQRAVLMKGAGETARAFYAFMQSPEAHKLLDHYGFTLPRTGQSKPR
>NC_020561.1|WP_015460044.1|3567066_3567735_-|molybdate-ABC-transporter-permease-subunit
MDWTAFALSLKLAGWTAALLLPIGLVASRALAFHARRSRPLFEAAVALPLVLPPTVLGYYLLVAFGGASPLGKLWTDLFGHGLAFSFHGLLAASVLINIPFAVQPMQRAFEALPADIREAAWVSGLTPWATFWRIELPLAWPGVLSAFVLTFAHTLGEFGVVLMVGGSIPGETRTAALAIYDRVQAFDNQAAGAMSLLLLLISIIAILIVHGLSGRIGRRRG
>NC_020561.1|WP_187294010.1|3566354_3567074_-|ATP-binding-cassette-domain-containing-protein
MAEGLGVSLAMARPVPIAVDFTCAPGELVALIGPSGAGKTTILRAIAGLDRAAAGRIACRGETWLDSAAGIRLPPHCRRVGLVFQSYALFPHLTAIGNVAAAIEGRPRGERLRRAAELLALVHLDGLEQRRPAELSGGQQQRVALARALAREPEALLLDEPFSAVDRRTRRRLREELAELRGRVRAPIILVTHDLDEATALADRLVVIDQGAMLQQGRPADVLAAPASERVRAALDLEG
>NC_020561.1|WP_015460042.1|3565688_3566102_-|nucleoside-diphosphate-kinase-regulator
MTKTDIPPSTRPPLHIIDSEYDAIAGIAMRAEHSQPELARLLMAELDRAEICDAASLPPDTAAMHSRISFIDEGSGASRTVELVYPQEADIEAGKISILTHVGAGLIGMRAGSSILWPDRDGRERRLKIVRIERPAP
>NC_020561.1|WP_051128854.1|3574603_3575254_+|glutathione-S-transferase-family-protein
MITVHHLENSRSHRILWLMEELGLDYAIERYKRRDRLFSPPEYERLHGLGKAPVITDGGRVVAESGAIIEYVIEVHGGGRLRPPVGSDDWVRYLQWMHLIEGSVMLPYIMGIYLEMLGPAGAPIHERIHGEIDRHFGFMERELSGRDHVVGDALTGADIQAAFVMEAASLRGMLDPYPALRRYLALMQARPAYRRALEKGGAHDLDDLRKGWQGRD
>NC_020561.1|WP_015460054.1|3575276_3575717_-|DUF2834-domain-containing-protein
MTMKELFYVAIGLVAIALTIYPNRHLLSRRAGGVSALEGFYYLIAIAALLVGWYFNFRFMREYGDEATWANWVRLLFVNPASASGGQDLLFANAVLFIPWTIVDGRRAGMKWNWIWFPMSAVTSFAFAMALFLALKERQLRWKAEA
>NC_020561.1|WP_015460055.1|3576026_3578162_-|NAD-dependent-DNA-ligase-LigA
MTTPPFPTDALAAAERLAWLAAEIARHNALYHDNDAPEISDAEFDALVRENNAIEAAFPHLVRADSPSRAVGSTPSGPLAKVTHAKAMLSLDNAFADEDVAEFVERIRRFLRLADDVPVAMTAEPKIDGLSCSIRYENGRLVQAATRGDGQVGEDVTPNVLTIADIPHRLPAGAPDLFEVRGEVYMAKADFRALNARLLAEAPDPEKARQFANPRNAAAGSLRQKDAAVTAARPLRFLAHGWGEVSALPADSQYGVMRAIAGWGLPVSDALVLVDSVAAMLAHYRAIETERADLPFDIDGVVYKVDRLDLQERLGFVARAPRWAIAHKFPAEQAQTTLRAIDTQVGRTGKITPVARLEPVTVGGVVVTNATLHNADEIERLGVRPGDRVVVQRAGDVIPQIVANLTREEPRAPWHFPTQCAECGSALAREEGEVDWRCTGGLICPAQRVERLRHFVSRHALDIEGLGLTHIEAFFRDGLIHSPADIYRLHERREALIARERWAETSVDNLIRAIDARRTPPLDRLLFALGIRHVGEVTARDLARRYSTWEALTAMIDAARARRAELVQAVGETDEKFRARTAKELAAIVETAGVGPEVAQALVDFFDEPHNQEVLADLLAQVTIEPVIHQTRASEVSGKTVVFTGSLETMSRDEAKAQAEALGAKTAGSVSSKTDLVVAGPGAGSKLKKAAELGIRVIDEAEWQAIVAAAG
>NC_020561.1|WP_015460057.1|3578653_3579418_-|response-regulator-transcription-factor
MRVLLVDDEVLALDRLKALFANVDGAEVVGQAMTGEEALEAIVTLKPDLVILDIQMPGRNGLRTAADIDVDPRPEIVFVTAHEHYAPDAFDVDAADYVLKPIRFDRLRQAVERARRRRVLREQAERVDVLEEQVQTLRSSAAESRDDAAFWIPERHGQRRVPLETINWIEAARDYVLLHTEMRSHMLRTTMSALEEKLAGSGLIRVHRSAFVRPERVMEVRRANRSIALVLEDGAEVQVGPSYSQVVDSALGLN
>NC_020561.1|WP_015460058.1|3579490_3580687_-|histidine-kinase
MELALRDESVILGQNGSHTHRGVTTFMPAAKSDARWADAVPLTIGLWLFMLLVFMPGIIARHPGDWVGVAIDSSTVCLSIGLGLLLFILFRGTADWQGGPRLVLMVAATIGMALASTIFDLKFTDWGARNLGGNWLAIPVDFKRASQSLLNYLCVFSVNVALFQFSFSRRRSLTRERQLAAAETAARQAELEALRLQLNPHFLFNTLNAISSLIVTRRNEDAEEMTDKLSSFLRASLACNPTELVPLEEELDLMADYLSIEAVRFGERLRVEISCTPEARAVHVPGLLIQPLVENAVKYGVARSAQPVTIAIDAVVDEGDLCIVITNDGGAGLPSVKSTATGVGLRNVRRRLAALYGERASLVAEPVGAGFLARICLPIDKDVVAALLHRQQGLPLPR
>NC_020561.1|WP_015460059.1|3580918_3582208_+|L,D-transpeptidase-family-protein
METSRTVGGRLRRSGRLVRWLAAAGATAMTTLALAGEPMTMGAGPAEASTAAPAAMAAAPTPAERWRPTDVAALLEEIDAAPGEGLDAAPYGGDAIRREMASGQGGAALDALADAAALRLAGDYLNGRVADRAGFDWHIERTDADPARLQAGLRQALAAGQVRPWLRSLLPADPRYAALREALAATPPADAGRRDRLAANMERWRWLPRDLGADHIYVNVPSYTLDLVDDGKPVSSYTVVVGAPATPTPQIAMAASSVVVNPWWNVPASIIRSSRLRPGAVNPARGYEFYPVGGGRYAVRQRPGPGNALGRIKIDMPNAHAIYLHDTPAKAYFDKPSRAFSHGCIRVKDIDRLAEEMVRLDHGRTADIERGLAGRTTTTVKLDTARPVWLVYFTAQAGPDGKVAMLEDPYNRDPRLIARLNGPMRLASR
>NC_020561.1|WP_015460060.1|3582317_3583745_-|DEAD/DEAH-box-helicase
MTFADLGLSDELLRAVAEAGYDEPTPIQAQAIPPVLMMKDLIGIAQTGTGKTASFVLPMIDILAHGRSRARMPRSLILEPTRELAAQVAENFEKYGKYHKLSMALLIGGVNMGDQVAALEKGVDVLIATPGRLMDLFQRGKILLTGCSLLVIDEADRMLDMGFIPDIEEICTKLPAQRQTLLFSATMPAPIKKLADRFLNNPKRIEVARVGTANASIEQKLVECQPRAKREVLRNLLSADDVRTAIIFCNRKTTVRELTTSLQRHGFHASQIHGDMDQSERLRELDRFKNGEINILVASDVAARGLDIKGVSHVFNFDVPWHPDDYVHRIGRTGRAGATGKAFTLVTPDDAEAVENIEKLAQQKIPRIGEAKPARAPAAAAEEKPARRARGAKAKPAEAEAKRADTEPKRADAEPKRAKAEDQPRREEKPRREERPARAAAAAPRHERRPADDGPGEGWNGPIPSFLDFGFGTRS
>NC_020561.1|WP_015460061.1|3583856_3584303_-|hypothetical-protein
MIGAELLSALLLSSGAAPPPESAAVTARFAQLTIRESVIIRVPTRGRQAIAPIEWKEGKGPKCLPMSEVAGATAVEEDSVDIILRGGGRVRAEFEDECPALDYYNGFYIRPTEDRRICAGRDSIHARSGGECQIRRFRTLTPVEGKKK
>NC_020561.1|WP_015460062.1|3584408_3585857_+|FAD-binding-oxidoreductase
MVSSPPDPAFLECLANRLGPRGFTADPADIDPWTIDWRGRVRGSAVALLSPADTTETADIVAMCAAAGVPLVPQGGNTSMVAGATPPANGSALILSTRRMRAIRSISAADGVAVVEAGVVLADLHDAAAVHGLRFPLSLAAKGSATIGGLVSTNAGGTQVLRFGPMRSLVLGIEAVLPDGSRFDGLSALRKDNRGYDLRQLLTGAEGTLGIVTAASLRLVPAIGRRAVAWAGLDSPQAALALLRRLEAATGEAVESFELVPDDALDLVIRHIPGSRAPLGGAHRWHALIEATAPQGAADPADALGQVLGQAMADGGVGDATIAASEAQAEALWRLRESISDAERADGMAAKHDISVPVSAMPDFILSARVAVEAAFPGTRVIAFGHLGDGNVHFNVRAPAGIPATGAEGMAWLAETGAAVSRMVNDLTVAAGGSISAEHGIGQTKLAEYARLADPARLAAQQAIKAALDPRWLMNPGKLVPR
>NC_020561.1|WP_015460063.1|3585975_3586752_+|SapC-family-protein
MASAPPSGLPLFYNQLQPLSSSLHADYVLRQRDSVPFLAGVHAVPLTVEEFGLAQRHYPIVFSSGPNPVPLALMGLNEGVNMFVGEDGKLAGDAYIPAYVRRYPFMLAKLQPNSEELSLCFDPTSDTVGQGGEGAALFADGQPSDATKGILGFCEQFEQAGQRTAAFMQELVDLKLLIDGEVSIQPEGAPQPFIYRGFQMIAEDKLRELRGDQARKLIQSGLLALVYAHLFSLSLIRDLFARQLQAGKVPAQQPQLQV

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Mismatch	Identity

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity
NC_020561_3	3.4\|1616818\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1616818-1616847	30	NZ_CP020908	Rhizobium etli strain NXC12 plasmid pRetNXC12b, complete sequence	234486-234515	4	0.867
NC_020561_3	3.1\|1616620\|30\|NC_020561\|CRISPRCasFinder,CRT	1616620-1616649	30	NZ_LR594668	Variovorax sp. SRS16 plasmid 3	336113-336142	5	0.833
NC_020561_3	3.1\|1616620\|30\|NC_020561\|CRISPRCasFinder,CRT	1616620-1616649	30	NZ_LR594673	Variovorax sp. PBL-E5 plasmid 3	515499-515528	5	0.833
NC_020561_3	3.2\|1616686\|30\|NC_020561\|CRISPRCasFinder,CRT	1616686-1616715	30	JQ680373	Unidentified phage clone 2209_scaffold64 genomic sequence	36556-36585	5	0.833
NC_020561_3	3.4\|1616818\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1616818-1616847	30	NC_007764	Rhizobium etli CFN 42 plasmid p42c, complete sequence	235268-235297	5	0.833
NC_020561_3	3.4\|1616818\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1616818-1616847	30	NZ_CP013597	Rhizobium sp. N741 plasmid pRspN741b, complete sequence	299039-299068	5	0.833
NC_020561_3	3.4\|1616818\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1616818-1616847	30	NC_021907	Rhizobium etli bv. mimosae str. Mim1 plasmid pRetMIM1b, complete sequence	237012-237041	5	0.833
NC_020561_3	3.4\|1616818\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1616818-1616847	30	NZ_CP013501	Rhizobium esperanzae strain N561 plasmid pRspN561a, complete sequence	299405-299434	5	0.833
NC_020561_3	3.4\|1616818\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1616818-1616847	30	NZ_CP013507	Rhizobium sp. N1341 plasmid pRspN1341b, complete sequence	299039-299068	5	0.833
NC_020561_3	3.4\|1616818\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1616818-1616847	30	NZ_CP013518	Rhizobium sp. N113 plasmid pRspN113a, complete sequence	299405-299434	5	0.833
NC_020561_3	3.4\|1616818\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1616818-1616847	30	NZ_CP013491	Rhizobium sp. N6212 plasmid pRspN6212a, complete sequence	299408-299437	5	0.833
NC_020561_3	3.4\|1616818\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1616818-1616847	30	NZ_CP013496	Rhizobium sp. N621 plasmid pRspN621a, complete sequence	299408-299437	5	0.833
NC_020561_3	3.4\|1616818\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1616818-1616847	30	NZ_CP013591	Rhizobium sp. N871 plasmid pRspN871a, complete sequence	299408-299437	5	0.833
NC_020561_3	3.3\|1616752\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1616752-1616781	30	NC_010463	Enterobacteria phage Fels-2, complete genome	14569-14598	6	0.8
NC_020561_3	3.3\|1616752\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1616752-1616781	30	KT630647	Salmonella phage SEN8, complete genome	10144-10173	6	0.8
NC_020561_3	3.3\|1616752\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1616752-1616781	30	NC_019488	Salmonella phage RE-2010, complete genome	19297-19326	6	0.8
NC_020561_3	3.11\|1617280\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617280-1617309	30	NC_018022	Mycolicibacterium chubuense NBB4 plasmid pMYCCH.01, complete sequence	447174-447203	6	0.8
NC_020561_3	3.11\|1617280\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617280-1617309	30	MF063068	Pseudomonas phage Noxifer, complete genome	179629-179658	6	0.8
NC_020561_3	3.12\|1617346\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617346-1617375	30	NZ_CP017563	Paraburkholderia sprentiae WSM5005 plasmid pl1WSM5005, complete sequence	123439-123468	6	0.8
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP017076	Novosphingobium resinovorum strain SA1 plasmid pSA1, complete sequence	577381-577410	6	0.8
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP046333	Cupriavidus metallidurans strain FDAARGOS_675 plasmid unnamed3	981029-981058	6	0.8
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NC_007974	Cupriavidus metallidurans CH34 megaplasmid, complete sequence	66193-66222	6	0.8
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NC_004808	Streptomyces rochei plasmid pSLA2-L DNA, complete sequence	139150-139179	6	0.8
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP038146	Streptomyces sp. S501 plasmid unnamed, complete sequence	56420-56449	6	0.8
NC_020561_3	3.1\|1616620\|30\|NC_020561\|CRISPRCasFinder,CRT	1616620-1616649	30	NC_019388	Thermus oshimai JL-2 plasmid pTHEOS02, complete sequence	24066-24095	7	0.767
NC_020561_3	3.1\|1616620\|30\|NC_020561\|CRISPRCasFinder,CRT	1616620-1616649	30	NZ_CP010824	Thermus aquaticus Y51MC23 plasmid pTA16, complete sequence	12430-12459	7	0.767
NC_020561_3	3.1\|1616620\|30\|NC_020561\|CRISPRCasFinder,CRT	1616620-1616649	30	NC_016586	Azospirillum lipoferum 4B plasmid AZO_p2, complete sequence	508762-508791	7	0.767
NC_020561_3	3.2\|1616686\|30\|NC_020561\|CRISPRCasFinder,CRT	1616686-1616715	30	NZ_CP017563	Paraburkholderia sprentiae WSM5005 plasmid pl1WSM5005, complete sequence	829111-829140	7	0.767
NC_020561_3	3.3\|1616752\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1616752-1616781	30	NC_049453	Klebsiella phage ST13-OXA48phi12.1, complete genome	21071-21100	7	0.767
NC_020561_3	3.11\|1617280\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617280-1617309	30	JX163858	Caulobacter phage phiCbK, complete genome	80456-80485	7	0.767
NC_020561_3	3.11\|1617280\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617280-1617309	30	KY555147	Caulobacter phage Ccr34, complete genome	127815-127844	7	0.767
NC_020561_3	3.11\|1617280\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617280-1617309	30	KY555145	Caulobacter phage Ccr29, complete genome	131672-131701	7	0.767
NC_020561_3	3.11\|1617280\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617280-1617309	30	KY555143	Caulobacter phage Ccr2, complete genome	127171-127200	7	0.767
NC_020561_3	3.11\|1617280\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617280-1617309	30	KY555146	Caulobacter phage Ccr32, complete genome	127375-127404	7	0.767
NC_020561_3	3.11\|1617280\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617280-1617309	30	KY555142	Caulobacter phage Ccr10, complete genome	126696-126725	7	0.767
NC_020561_3	3.11\|1617280\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617280-1617309	30	NZ_LS974446	Rhizobium selenitireducens ATCC BAA-1503 isolate T2.30D-1.1_plasmid plasmid 1, complete sequence	154923-154952	7	0.767
NC_020561_3	3.12\|1617346\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617346-1617375	30	NC_017958	Tistrella mobilis KA081020-065 plasmid pTM3, complete sequence	242733-242762	7	0.767
NC_020561_3	3.12\|1617346\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617346-1617375	30	NZ_CP031752	Rhodobacter sphaeroides strain EBL0706 plasmid p.A, complete sequence	170913-170942	7	0.767
NC_020561_3	3.12\|1617346\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617346-1617375	30	NZ_AP022334	Methylosinus sp. C49 isolate Methylosinus sp. C49 plasmid pMSC49b, complete sequence	141743-141772	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP016613	Ralstonia solanacearum FJAT-91 plasmid unnamed1, complete sequence	576650-576679	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP021449	Ralstonia solanacearum strain SEPPX05 plasmid pSEPPX05, complete sequence	2035492-2035521	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP049794	Ralstonia solanacearum strain 204 plasmid unnamed, complete sequence	583048-583077	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP049788	Ralstonia solanacearum strain B2 plasmid unnamed, complete sequence	1882998-1883027	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP039340	Ralstonia solanacearum strain UW386 plasmid pUW386, complete sequence	868075-868104	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NC_016113	Streptomyces cattleya NRRL 8057 = DSM 46488 plasmid pSCAT, complete sequence	1250244-1250273	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NC_016113	Streptomyces cattleya NRRL 8057 = DSM 46488 plasmid pSCAT, complete sequence	85518-85547	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP012940	Ralstonia solanacearum strain UW163 plasmid unnamed, complete sequence	1919859-1919888	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP012944	Ralstonia solanacearum strain IBSBF1503 plasmid unnamed, complete sequence	1923526-1923555	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP049792	Ralstonia solanacearum strain 203 plasmid unnamed, complete sequence	364524-364553	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP010871	Confluentimicrobium sp. EMB200-NS6 strain EMBL200_NS6 plasmid pNS6002, complete sequence	36532-36561	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP015851	Ralstonia solanacearum strain YC40-M plasmid, complete sequence	329400-329429	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_AP014687	Bradyrhizobium diazoefficiens strain NK6 plasmid pNK6c, complete sequence	100889-100918	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP022791	Ralstonia solanacearum strain SL3103 plasmid unnamed, complete sequence	1955851-1955880	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP022482	Ralstonia solanacearum strain HA4-1 plasmid HA4-1MP, complete sequence	1030745-1030774	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	CP047139	Ralstonia solanacearum strain CFBP 8695 plasmid unnamed, complete sequence	85299-85328	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP051295	Ralstonia solanacearum strain CIAT_078 plasmid megaplasmid, complete sequence	1896252-1896281	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	CP047137	Ralstonia solanacearum strain CFBP 8697 plasmid unnamed, complete sequence	74680-74709	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP026091	Ralstonia solanacearum strain IBSBF 2570 plasmid unnamed, complete sequence	83370-83399	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NC_014309	Ralstonia solanacearum CFBP2957 plasmid RCFBPv3_mp, complete genome	62380-62409	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	CP023013	Ralstonia solanacearum strain T110 plasmid unnamed, complete sequence	52411-52440	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP021653	Ralstonia solanacearum strain RS 488 plasmid unnamed, complete sequence	67761-67790	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NC_014310	Ralstonia solanacearum PSI07 plasmid mpPSI07, complete sequence	64548-64577	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP022762	Ralstonia solanacearum strain T95 plasmid unnamed, complete sequence	94237-94266	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP049790	Ralstonia solanacearum strain 202 plasmid unnamed, complete sequence	68602-68631	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP020716	Cnuibacter physcomitrellae strain XA(T) plasmid unnamed1, complete sequence	201984-202013	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP022766	Ralstonia solanacearum strain T78 plasmid unnamed, complete sequence	53642-53671	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP021763	Ralstonia pseudosolanacearum strain RS 476 plasmid unnamed, complete sequence	89259-89288	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP026093	Ralstonia solanacearum strain SFC plasmid unnamed, complete sequence	83364-83393	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP021767	Ralstonia solanacearum strain RS 489 plasmid unnamed, complete sequence	67788-67817	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP015116	Ralstonia solanacearum strain EP1 plasmid unnamed, complete sequence	212409-212438	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP016555	Ralstonia solanacearum FJAT-1458 plasmid plas1, complete sequence	1782211-1782240	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP012688	Ralstonia solanacearum strain UY031 plasmid unnamed, complete sequence	67761-67790	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP052069	Ralstonia solanacearum strain FJAT91.F50 plasmid Plas1, complete sequence	53379-53408	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP016915	Ralstonia solanacearum strain CQPS-1 plasmid unnamed, complete sequence	663425-663454	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP016905	Ralstonia solanacearum strain KACC 10709 plasmid unnamed1	1092381-1092410	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP025986	Ralstonia solanacearum strain RSCM plasmid p-unname2, complete sequence	285048-285077	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP022769	Ralstonia solanacearum strain T60 plasmid unnamed, complete sequence	54851-54880	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP023017	Ralstonia solanacearum strain SL3022 plasmid unnamed, complete sequence	66589-66618	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NC_017585	Streptomyces cattleya NRRL 8057 = DSM 46488 plasmid pSCATT, complete sequence	563292-563321	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NC_017585	Streptomyces cattleya NRRL 8057 = DSM 46488 plasmid pSCATT, complete sequence	1727600-1727629	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP022773	Ralstonia solanacearum strain T42 plasmid unnamed, complete sequence	57473-57502	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP022783	Ralstonia solanacearum strain SL3755 plasmid unnamed, complete sequence	52461-52490	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP014703	Ralstonia solanacearum strain KACC 10722 plasmid, complete sequence	94237-94266	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP022760	Ralstonia solanacearum strain T98 plasmid unnamed, complete sequence	67114-67143	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP022789	Ralstonia solanacearum strain SL3175 plasmid unnamed, complete sequence	67114-67143	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP022795	Ralstonia solanacearum strain SL2330 plasmid unnamed, complete sequence	52466-52495	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP052071	Ralstonia solanacearum strain FJAT454.F1 plasmid Plas1, complete sequence	68443-68472	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NC_017575	Ralstonia solanacearum Po82 megaplasmid, complete sequence	83336-83365	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP022771	Ralstonia solanacearum strain T51 plasmid unnamed, complete sequence	94247-94276	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP022777	Ralstonia solanacearum strain T11 plasmid unnamed, complete sequence	94266-94295	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP022799	Ralstonia solanacearum strain SL2064 plasmid unnamed, complete sequence	94237-94266	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP009763	Ralstonia solanacearum OE1-1 plasmid unnamed, complete sequence	53345-53374	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	CP023015	Ralstonia solanacearum strain T25 plasmid unnamed, complete sequence	52450-52479	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP022779	Ralstonia solanacearum strain SL3882 plasmid unnamed, complete sequence	54851-54880	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP052075	Ralstonia solanacearum strain FJAT448.F1 plasmid Plas1, complete sequence	68443-68472	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP052085	Ralstonia solanacearum strain FJAT15353.F8 plasmid Plas1, complete sequence	70942-70971	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP052095	Ralstonia solanacearum strain FJAT15340.F1 plasmid Plas1, complete sequence	53393-53422	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP052105	Ralstonia solanacearum strain FJAT15252.F1 plasmid Plas1, complete sequence	68443-68472	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP026308	Ralstonia solanacearum strain IBSBF 2571 plasmid unnamed, complete sequence	83336-83365	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP021765	Ralstonia pseudosolanacearum strain CRMRs218 plasmid unnamed, complete sequence	89264-89293	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP052077	Ralstonia solanacearum strain FJAT445.F50 plasmid Plas1, complete sequence	55213-55242	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP052087	Ralstonia solanacearum strain FJAT15353.F50 plasmid Plas1, complete sequence	70942-70971	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP052097	Ralstonia solanacearum strain FJAT15304.F6 plasmid Plas1, complete sequence	53393-53422	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP052115	Ralstonia solanacearum strain FJAT1463.F50 plasmid Plas1, complete sequence	68443-68472	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP052127	Ralstonia solanacearum strain FJAT1303.F50 plasmid Plas1, complete sequence	70942-70971	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP052079	Ralstonia solanacearum strain FJAT445.F1 plasmid Plas1, complete sequence	55213-55242	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP052089	Ralstonia solanacearum strain FJAT15353.F1 plasmid Plas1, complete sequence	70942-70971	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP052093	Ralstonia solanacearum strain FJAT15340.F50 plasmid Plas1, complete sequence	53393-53422	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP052101	Ralstonia solanacearum strain FJAT15304.F1 plasmid Plas1, complete sequence	53393-53422	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP052099	Ralstonia solanacearum strain FJAT15304.F50 plasmid Plas1, complete sequence	53393-53422	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP052107	Ralstonia solanacearum strain FJAT15249.F50 plasmid Plas1, complete sequence	68443-68472	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP022781	Ralstonia solanacearum strain SL3822 plasmid unnamed, complete sequence	53640-53669	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP052117	Ralstonia solanacearum strain FJAT1463.F1 plasmid Plas1, complete sequence	68443-68472	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP052125	Ralstonia solanacearum strain FJAT1452.F1 plasmid Plas1, complete sequence	55213-55242	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP022793	Ralstonia solanacearum strain SL2729 plasmid unnamed, complete sequence	57474-57503	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP022785	Ralstonia solanacearum strain SL3730 plasmid unnamed, complete sequence	57470-57499	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP022787	Ralstonia solanacearum strain SL3300 plasmid unnamed, complete sequence	54818-54847	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP022756	Ralstonia solanacearum strain T117 plasmid unnamed, complete sequence	55706-55735	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP052129	Ralstonia solanacearum strain FJAT1303.F1 plasmid Plas1, complete sequence	52215-52244	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP052121	Ralstonia solanacearum strain FJAT1458.F1 plasmid Plas1, complete sequence	68443-68472	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP052123	Ralstonia solanacearum strain FJAT1452.F50 plasmid Plas1, complete sequence	55213-55242	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP052131	Ralstonia solanacearum strain FJAT1303.F8 plasmid Plas1, complete sequence	70942-70971	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	CP011998	Ralstonia solanacearum strain YC45 plasmid, complete sequence	89661-89690	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP052073	Ralstonia solanacearum strain FJAT448.F50 plasmid Plas1, complete sequence	68443-68472	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP052081	Ralstonia solanacearum strain FJAT442.F50 plasmid Plas1, complete sequence	55213-55242	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP052083	Ralstonia solanacearum strain FJAT442.F1 plasmid Plas1, complete sequence	55213-55242	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP052109	Ralstonia solanacearum strain FJAT15249.F1 plasmid Plas1, complete sequence	68443-68472	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP052091	Ralstonia solanacearum strain FJAT15340.F6 plasmid Plas1, complete sequence	53393-53422	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP052111	Ralstonia solanacearum strain FJAT15244.F50 plasmid Plas1, complete sequence	53768-53797	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP052103	Ralstonia solanacearum strain FJAT15252.F50 plasmid Plas1, complete sequence	68443-68472	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP052119	Ralstonia solanacearum strain FJAT1458.F50 plasmid Plas1, complete sequence	68443-68472	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP052113	Ralstonia solanacearum strain FJAT15244.F1 plasmid Plas1, complete sequence	53768-53797	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	MT316461	Streptomyces phage Galactica, complete genome	65519-65548	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP012477	Arthrobacter sp. ERGS1:01 isolate water plasmid unnamed2, complete sequence	47264-47293	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_AP014705	Methylobacterium aquaticum strain MA-22A plasmid pMaq22A_1p, complete sequence	1523942-1523971	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	MN284893	Mycobacterium phage LilMcDreamy, complete genome	68798-68827	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP019036	Massilia putida strain 6NM-7 plasmid unnamed1, complete sequence	61645-61674	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NC_023316	Streptomyces sp. 14R-10 plasmid pZL1, complete sequence	119713-119742	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP025016	Rhizobium leguminosarum strain Norway plasmid pRLN4, complete sequence	160562-160591	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_LR134452	Tsukamurella tyrosinosolvens strain NCTC13231 plasmid 10, complete sequence	335987-336016	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	CP053919	Serratia marcescens strain LY1 plasmid unnamed1, complete sequence	99240-99269	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	CP053919	Serratia marcescens strain LY1 plasmid unnamed1, complete sequence	99639-99668	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	CP053919	Serratia marcescens strain LY1 plasmid unnamed1, complete sequence	100038-100067	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	CP053919	Serratia marcescens strain LY1 plasmid unnamed1, complete sequence	100437-100466	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	CP053919	Serratia marcescens strain LY1 plasmid unnamed1, complete sequence	100836-100865	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	CP053919	Serratia marcescens strain LY1 plasmid unnamed1, complete sequence	101235-101264	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	CP053919	Serratia marcescens strain LY1 plasmid unnamed1, complete sequence	101634-101663	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	CP053919	Serratia marcescens strain LY1 plasmid unnamed1, complete sequence	102033-102062	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	CP053919	Serratia marcescens strain LY1 plasmid unnamed1, complete sequence	102432-102461	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	CP053919	Serratia marcescens strain LY1 plasmid unnamed1, complete sequence	102831-102860	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP022363	Azospirillum sp. TSH58 plasmid TSH58_p03, complete sequence	266255-266284	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	JN564907	Burkholderia phage AH2, complete genome	12157-12186	7	0.767
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	MN813697	Mycobacterium phage Noelle, complete genome	29848-29877	7	0.767
NC_020561_3	3.3\|1616752\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1616752-1616781	30	NZ_CP014683	Kozakia baliensis strain NBRC 16680 plasmid pKB16680_2, complete sequence	79945-79974	8	0.733
NC_020561_3	3.9\|1617148\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617148-1617177	30	MN034485	Leviviridae sp. isolate H2_Bulk_34_354 hypothetical protein (H2Bulk34354_000001) gene, partial cds; and hypothetical protein (H2Bulk34354_000002) and RNA-dependent RNA polymerase (H2Bulk34354_000003) genes, complete cds	2356-2385	8	0.733
NC_020561_3	3.11\|1617280\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617280-1617309	30	NC_019410	Caulobacter phage CcrKarma, complete genome	127890-127919	8	0.733
NC_020561_3	3.11\|1617280\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617280-1617309	30	NC_019407	Caulobacter phage CcrMagneto, complete genome	126091-126120	8	0.733
NC_020561_3	3.11\|1617280\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617280-1617309	30	KY555144	Caulobacter phage Ccr5, complete genome	127063-127092	8	0.733
NC_020561_3	3.11\|1617280\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617280-1617309	30	NC_019411	Caulobacter phage CcrSwift, complete genome	126654-126683	8	0.733
NC_020561_3	3.12\|1617346\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617346-1617375	30	NZ_CP047174	Rathayibacter sp. VKM Ac-2760 plasmid unnamed1, complete sequence	144341-144370	8	0.733
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NC_018022	Mycolicibacterium chubuense NBB4 plasmid pMYCCH.01, complete sequence	111022-111051	8	0.733
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP039340	Ralstonia solanacearum strain UW386 plasmid pUW386, complete sequence	522758-522787	8	0.733
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NC_015583	Novosphingobium sp. PP1Y plasmid Mpl, complete sequence	106028-106057	8	0.733
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP050083	Rhizobium leguminosarum bv. trifolii strain 31B plasmid pRL31b3, complete sequence	302835-302864	8	0.733
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NC_012811	Methylorubrum extorquens AM1 megaplasmid, complete sequence	667360-667389	8	0.733
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NC_012586	Sinorhizobium fredii NGR234 plasmid pNGR234b, complete sequence	2314793-2314822	8	0.733
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP049733	Rhizobium leguminosarum strain A1 plasmid pRL10, complete sequence	293804-293833	8	0.733
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP024310	Sinorhizobium fredii strain NXT3 plasmid pSfreNXT3c, complete sequence	1511283-1511312	8	0.733
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP045120	Rubrobacter sp. SCSIO 52909 plasmid unnamed1, complete sequence	7563-7592	8	0.733
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP023064	Sinorhizobium sp. CCBAU 05631 plasmid pSS05631b, complete sequence	1327479-1327508	8	0.733
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_LR594663	Variovorax sp. RA8 plasmid 2	303045-303074	8	0.733
NC_020561_3	3.15\|1617544\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617544-1617573	30	NZ_CP015092	Pelagibaca abyssi strain JLT2014 plasmid pPABY3, complete sequence	896-925	8	0.733
NC_020561_3	3.15\|1617544\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617544-1617573	30	NZ_CP049032	Fluviibacterium aquatile strain SC52 plasmid pSC52_4, complete sequence	34385-34414	8	0.733
NC_020561_3	3.15\|1617544\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617544-1617573	30	NZ_CP031601	Roseovarius indicus strain DSM 26383 plasmid pRIdsm_03, complete sequence	7104-7133	8	0.733
NC_020561_3	3.15\|1617544\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617544-1617573	30	NZ_CP004395	Celeribacter indicus strain P73 plasmid pP73B, complete sequence	9878-9907	8	0.733
NC_020561_3	3.19\|1617822\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617822-1617851	30	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	1700388-1700417	8	0.733
NC_020561_3	3.21\|1617954\|31\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617954-1617984	31	NZ_LR594668	Variovorax sp. SRS16 plasmid 3	245642-245672	8	0.742
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP049794	Ralstonia solanacearum strain 204 plasmid unnamed, complete sequence	325911-325940	9	0.7
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP049792	Ralstonia solanacearum strain 203 plasmid unnamed, complete sequence	107387-107416	9	0.7
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP049790	Ralstonia solanacearum strain 202 plasmid unnamed, complete sequence	325739-325768	9	0.7
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP016915	Ralstonia solanacearum strain CQPS-1 plasmid unnamed, complete sequence	920551-920580	9	0.7
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP052085	Ralstonia solanacearum strain FJAT15353.F8 plasmid Plas1, complete sequence	324206-324235	9	0.7
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP052087	Ralstonia solanacearum strain FJAT15353.F50 plasmid Plas1, complete sequence	324206-324235	9	0.7
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP052127	Ralstonia solanacearum strain FJAT1303.F50 plasmid Plas1, complete sequence	324206-324235	9	0.7
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP052089	Ralstonia solanacearum strain FJAT15353.F1 plasmid Plas1, complete sequence	324206-324235	9	0.7
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP052131	Ralstonia solanacearum strain FJAT1303.F8 plasmid Plas1, complete sequence	324206-324235	9	0.7
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_AP022593	Mycolicibacterium arabiense strain JCM 18538 plasmid pJCM18538, complete sequence	5366445-5366474	9	0.7
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP021813	Sinorhizobium meliloti strain M270 plasmid psymA, complete sequence	17996-18025	9	0.7
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP045074	Paracoccus kondratievae strain BJQ0001 plasmid unnamed1, complete sequence	8483-8512	9	0.7
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NZ_CP021819	Sinorhizobium meliloti strain M162 plasmid psymA, complete sequence	354253-354282	9	0.7
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NC_020548	Azoarcus sp. KH32C plasmid pAZKH, complete sequence	547335-547364	9	0.7
NC_020561_3	3.13\|1617412\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617412-1617441	30	NC_009620	Sinorhizobium medicae WSM419 plasmid pSMED01, complete sequence	959399-959428	9	0.7
NC_020561_3	3.14\|1617478\|30\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617478-1617507	30	NC_000914	Sinorhizobium fredii NGR234 plasmid pNGR234a, complete sequence	391584-391613	9	0.7
NC_020561_3	3.21\|1617954\|31\|NC_020561\|CRISPRCasFinder,CRT,PILER-CR	1617954-1617984	31	MN035828	Leviviridae sp. isolate H3_Bulk_Litter_17_scaffold_1122 RNA-dependent RNA polymerase (H3BulkLitter171122_000001) and hypothetical protein (H3BulkLitter171122_000002) genes, complete cds; and hypothetical protein (H3BulkLitter171122_000003) gene, partial cds	1228-1258	9	0.71

1. spacer 3.4|1616818|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP020908 (Rhizobium etli strain NXC12 plasmid pRetNXC12b, complete sequence) position: , mismatch: 4, identity: 0.867

agtgatgactgacatcgcaacg-atagcggc	CRISPR spacer
ggtgacgactgacatcgcaacgaagagcgg-	Protospacer
.****.**************** * *****

2. spacer 3.1|1616620|30|NC_020561|CRISPRCasFinder,CRT matches to NZ_LR594668 (Variovorax sp. SRS16 plasmid 3) position: , mismatch: 5, identity: 0.833

cgggcaagacggttgggcgacgcgcgtttg	CRISPR spacer
tgggcaagacggtcgggcggcgcgcggtcg	Protospacer
.************.*****.****** *.*

3. spacer 3.1|1616620|30|NC_020561|CRISPRCasFinder,CRT matches to NZ_LR594673 (Variovorax sp. PBL-E5 plasmid 3) position: , mismatch: 5, identity: 0.833

cgggcaagacggttgggcgacgcgcgtttg	CRISPR spacer
tgggcaagacggtcgggcggcgcgcggtcg	Protospacer
.************.*****.****** *.*

4. spacer 3.2|1616686|30|NC_020561|CRISPRCasFinder,CRT matches to JQ680373 (Unidentified phage clone 2209_scaffold64 genomic sequence) position: , mismatch: 5, identity: 0.833

gaagttcgccgggtctacgcacgcgctttc	CRISPR spacer
gtagttggccgggtctacgcacgcgctgct	Protospacer
* **** ******************** ..

5. spacer 3.4|1616818|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NC_007764 (Rhizobium etli CFN 42 plasmid p42c, complete sequence) position: , mismatch: 5, identity: 0.833

agtgatgactgacatcgcaacg-atagcggc	CRISPR spacer
ggtgacgactgacatcgcaacgaagagtgg-	Protospacer
.****.**************** * **.**

6. spacer 3.4|1616818|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP013597 (Rhizobium sp. N741 plasmid pRspN741b, complete sequence) position: , mismatch: 5, identity: 0.833

agtgatgactgacatcgcaacg-atagcggc	CRISPR spacer
ggtgacgactgacatcgcaacgaagagtgg-	Protospacer
.****.**************** * **.**

7. spacer 3.4|1616818|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NC_021907 (Rhizobium etli bv. mimosae str. Mim1 plasmid pRetMIM1b, complete sequence) position: , mismatch: 5, identity: 0.833

agtgatgactgacatcgcaacg-atagcggc	CRISPR spacer
ggtgacgactgacatcgcaacgaagagtgg-	Protospacer
.****.**************** * **.**

8. spacer 3.4|1616818|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP013501 (Rhizobium esperanzae strain N561 plasmid pRspN561a, complete sequence) position: , mismatch: 5, identity: 0.833

agtgatgactgacatcgcaacg-atagcggc	CRISPR spacer
ggtgacgactgacatcgcaacgaagagtgg-	Protospacer
.****.**************** * **.**

9. spacer 3.4|1616818|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP013507 (Rhizobium sp. N1341 plasmid pRspN1341b, complete sequence) position: , mismatch: 5, identity: 0.833

agtgatgactgacatcgcaacg-atagcggc	CRISPR spacer
ggtgacgactgacatcgcaacgaagagtgg-	Protospacer
.****.**************** * **.**

10. spacer 3.4|1616818|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP013518 (Rhizobium sp. N113 plasmid pRspN113a, complete sequence) position: , mismatch: 5, identity: 0.833

agtgatgactgacatcgcaacg-atagcggc	CRISPR spacer
ggtgacgactgacatcgcaacgaagagtgg-	Protospacer
.****.**************** * **.**

11. spacer 3.4|1616818|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP013491 (Rhizobium sp. N6212 plasmid pRspN6212a, complete sequence) position: , mismatch: 5, identity: 0.833

agtgatgactgacatcgcaacg-atagcggc	CRISPR spacer
ggtgacgactgacatcgcaacgaagagtgg-	Protospacer
.****.**************** * **.**

12. spacer 3.4|1616818|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP013496 (Rhizobium sp. N621 plasmid pRspN621a, complete sequence) position: , mismatch: 5, identity: 0.833

agtgatgactgacatcgcaacg-atagcggc	CRISPR spacer
ggtgacgactgacatcgcaacgaagagtgg-	Protospacer
.****.**************** * **.**

13. spacer 3.4|1616818|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP013591 (Rhizobium sp. N871 plasmid pRspN871a, complete sequence) position: , mismatch: 5, identity: 0.833

agtgatgactgacatcgcaacg-atagcggc	CRISPR spacer
ggtgacgactgacatcgcaacgaagagtgg-	Protospacer
.****.**************** * **.**

14. spacer 3.3|1616752|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NC_010463 (Enterobacteria phage Fels-2, complete genome) position: , mismatch: 6, identity: 0.8

cctatgtccgtaacaacccggacgtggccg-	CRISPR spacer
cctatgtccgggacaacccggaca-agctgc	Protospacer
********** .***********. .**.*

15. spacer 3.3|1616752|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to KT630647 (Salmonella phage SEN8, complete genome) position: , mismatch: 6, identity: 0.8

cctatgtccgtaacaacccggacgtggccg-	CRISPR spacer
cctatgtccgggacaacccggaca-agctgc	Protospacer
********** .***********. .**.*

16. spacer 3.3|1616752|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NC_019488 (Salmonella phage RE-2010, complete genome) position: , mismatch: 6, identity: 0.8

cctatgtccgtaacaacccggacgtggccg-	CRISPR spacer
cctatgtccgcaataacccggaca-agctgc	Protospacer
**********.**.*********. .**.*

17. spacer 3.11|1617280|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NC_018022 (Mycolicibacterium chubuense NBB4 plasmid pMYCCH.01, complete sequence) position: , mismatch: 6, identity: 0.8

cgcgg-cgagacccacgtcaacaacctgctg	CRISPR spacer
-gtgatccagaccgaggtcaacaacctgctg	Protospacer
 *.*. * ***** * ***************

18. spacer 3.11|1617280|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to MF063068 (Pseudomonas phage Noxifer, complete genome) position: , mismatch: 6, identity: 0.8

cgcgg-cgagacccacgtcaacaacctgctg	CRISPR spacer
-gtgaccaagacctacgtcaacaacctgatg	Protospacer
 *.*. *.*****.************** **

19. spacer 3.12|1617346|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP017563 (Paraburkholderia sprentiae WSM5005 plasmid pl1WSM5005, complete sequence) position: , mismatch: 6, identity: 0.8

gcccatcccgagctcgcgcttgtagcgcat	CRISPR spacer
ggcggtttcgagctcgcgcttgtagcccat	Protospacer
* * .*..****************** ***

20. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP017076 (Novosphingobium resinovorum strain SA1 plasmid pSA1, complete sequence) position: , mismatch: 6, identity: 0.8

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
ggtcgatgccgcgatggcggcggtccagcc	Protospacer
*.*.  *****************.**** *

21. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP046333 (Cupriavidus metallidurans strain FDAARGOS_675 plasmid unnamed3) position: , mismatch: 6, identity: 0.8

gattcttg---ccgcgatggcggcggcccaggc	CRISPR spacer
---tcccgagtccgcgatggcggcggaccaggc	Protospacer
   **..*   *************** ******

22. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NC_007974 (Cupriavidus metallidurans CH34 megaplasmid, complete sequence) position: , mismatch: 6, identity: 0.8

gattcttg---ccgcgatggcggcggcccaggc	CRISPR spacer
---tcccgagtccgcgatggcggcggaccaggc	Protospacer
   **..*   *************** ******

23. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NC_004808 (Streptomyces rochei plasmid pSLA2-L DNA, complete sequence) position: , mismatch: 6, identity: 0.8

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
gacgcacgccgcgatcgcggcggccgaggc	Protospacer
**. * .******** ********* ****

24. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP038146 (Streptomyces sp. S501 plasmid unnamed, complete sequence) position: , mismatch: 6, identity: 0.8

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
gatctccgccgcgatggcggcggctgaggc	Protospacer
***....*****************. ****

25. spacer 3.1|1616620|30|NC_020561|CRISPRCasFinder,CRT matches to NC_019388 (Thermus oshimai JL-2 plasmid pTHEOS02, complete sequence) position: , mismatch: 7, identity: 0.767

cgggcaagacggttgggcgacgcgcgtttg	CRISPR spacer
ggggccagacggttgggcgacgcggaaagg	Protospacer
 **** ****************** .   *

26. spacer 3.1|1616620|30|NC_020561|CRISPRCasFinder,CRT matches to NZ_CP010824 (Thermus aquaticus Y51MC23 plasmid pTA16, complete sequence) position: , mismatch: 7, identity: 0.767

cgggcaagacggttgggcgacgcgcgtttg	CRISPR spacer
ggggccagacggttgggcgacgcggaaagg	Protospacer
 **** ****************** .   *

27. spacer 3.1|1616620|30|NC_020561|CRISPRCasFinder,CRT matches to NC_016586 (Azospirillum lipoferum 4B plasmid AZO_p2, complete sequence) position: , mismatch: 7, identity: 0.767

cgggcaagacggttgggcgacgcgcgtttg	CRISPR spacer
cgggccagacggctgggcgacgcggtcgag	Protospacer
***** ******.***********  .  *

28. spacer 3.2|1616686|30|NC_020561|CRISPRCasFinder,CRT matches to NZ_CP017563 (Paraburkholderia sprentiae WSM5005 plasmid pl1WSM5005, complete sequence) position: , mismatch: 7, identity: 0.767

gaagttcgccgggtctacgcacgcgctttc	CRISPR spacer
gttaatcgccgggtcaacgcacgcgctaac	Protospacer
*  . ********** ***********  *

29. spacer 3.3|1616752|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NC_049453 (Klebsiella phage ST13-OXA48phi12.1, complete genome) position: , mismatch: 7, identity: 0.767

cctatgtccgtaacaacccggacgtggccg-	CRISPR spacer
cgtatgtccgtgacaacccggaca-aactgc	Protospacer
* *********.***********. ..*.*

30. spacer 3.11|1617280|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to JX163858 (Caulobacter phage phiCbK, complete genome) position: , mismatch: 7, identity: 0.767

cgcggcgagacccacgtcaacaacctgctg	CRISPR spacer
accctgaagacccaggtcaacaacctgctg	Protospacer
  *   .******* ***************

31. spacer 3.11|1617280|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to KY555147 (Caulobacter phage Ccr34, complete genome) position: , mismatch: 7, identity: 0.767

cgcggcgagacccacgtcaacaacctgctg	CRISPR spacer
accctgaagacccaggtcaacaacctgctg	Protospacer
  *   .******* ***************

32. spacer 3.11|1617280|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to KY555145 (Caulobacter phage Ccr29, complete genome) position: , mismatch: 7, identity: 0.767

cgcggcgagacccacgtcaacaacctgctg	CRISPR spacer
accctgaagacccaggtcaacaacctgctg	Protospacer
  *   .******* ***************

33. spacer 3.11|1617280|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to KY555143 (Caulobacter phage Ccr2, complete genome) position: , mismatch: 7, identity: 0.767

cgcggcgagacccacgtcaacaacctgctg	CRISPR spacer
accctgaagacccaggtcaacaacctgctg	Protospacer
  *   .******* ***************

34. spacer 3.11|1617280|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to KY555146 (Caulobacter phage Ccr32, complete genome) position: , mismatch: 7, identity: 0.767

cgcggcgagacccacgtcaacaacctgctg	CRISPR spacer
accctgaagacccaggtcaacaacctgctg	Protospacer
  *   .******* ***************

35. spacer 3.11|1617280|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to KY555142 (Caulobacter phage Ccr10, complete genome) position: , mismatch: 7, identity: 0.767

cgcggcgagacccacgtcaacaacctgctg	CRISPR spacer
accctgaagacccaggtcaacaacctgctg	Protospacer
  *   .******* ***************

36. spacer 3.11|1617280|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_LS974446 (Rhizobium selenitireducens ATCC BAA-1503 isolate T2.30D-1.1_plasmid plasmid 1, complete sequence) position: , mismatch: 7, identity: 0.767

cgcggcgagacccacgtcaacaacctgctg	CRISPR spacer
ccgaccaagacccacatcatcaacctgctg	Protospacer
*  . *.********.*** **********

37. spacer 3.12|1617346|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NC_017958 (Tistrella mobilis KA081020-065 plasmid pTM3, complete sequence) position: , mismatch: 7, identity: 0.767

gcccatcccgagctcgcgcttgtagcgcat	CRISPR spacer
gatgatctcgacctcgcgcttgtagcgctc	Protospacer
* . ***.*** **************** .

38. spacer 3.12|1617346|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP031752 (Rhodobacter sphaeroides strain EBL0706 plasmid p.A, complete sequence) position: , mismatch: 7, identity: 0.767

gcccatcccgagctcgcgcttgtagcgcat	CRISPR spacer
gctgatcccgagctcgcgctggaagcggtc	Protospacer
**. **************** * ****  .

39. spacer 3.12|1617346|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_AP022334 (Methylosinus sp. C49 isolate Methylosinus sp. C49 plasmid pMSC49b, complete sequence) position: , mismatch: 7, identity: 0.767

gcccatcccgagctcgcgcttgtagcgcat	CRISPR spacer
gcccatcccgggctcgcgcttttgcagcgc	Protospacer
**********.********** *.  **..

40. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP016613 (Ralstonia solanacearum FJAT-91 plasmid unnamed1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

41. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP021449 (Ralstonia solanacearum strain SEPPX05 plasmid pSEPPX05, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgtaccaggc	Protospacer
 ...* ****************  ******

42. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP049794 (Ralstonia solanacearum strain 204 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

43. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP049788 (Ralstonia solanacearum strain B2 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

44. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP039340 (Ralstonia solanacearum strain UW386 plasmid pUW386, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

45. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NC_016113 (Streptomyces cattleya NRRL 8057 = DSM 46488 plasmid pSCAT, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
ccggcgtgccgcggtggcggcggccccggc	Protospacer
    * *******.************ ***

46. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NC_016113 (Streptomyces cattleya NRRL 8057 = DSM 46488 plasmid pSCAT, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
gccgccggccgcgatggtgggggcccaggc	Protospacer
* . *. **********.** *********

47. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP012940 (Ralstonia solanacearum strain UW163 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

48. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP012944 (Ralstonia solanacearum strain IBSBF1503 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

49. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP049792 (Ralstonia solanacearum strain 203 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

50. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP010871 (Confluentimicrobium sp. EMB200-NS6 strain EMBL200_NS6 plasmid pNS6002, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
ccttcttgccgcgatggaggctgcccgagt	Protospacer
  *************** *** ****..*.

51. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP015851 (Ralstonia solanacearum strain YC40-M plasmid, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

52. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_AP014687 (Bradyrhizobium diazoefficiens strain NK6 plasmid pNK6c, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
gagcggcgccgcgatggcggcggccgaggg	Protospacer
** .  .****************** ***

53. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP022791 (Ralstonia solanacearum strain SL3103 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

54. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP022482 (Ralstonia solanacearum strain HA4-1 plasmid HA4-1MP, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

55. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to CP047139 (Ralstonia solanacearum strain CFBP 8695 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

56. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP051295 (Ralstonia solanacearum strain CIAT_078 plasmid megaplasmid, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

57. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to CP047137 (Ralstonia solanacearum strain CFBP 8697 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

58. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP026091 (Ralstonia solanacearum strain IBSBF 2570 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

59. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NC_014309 (Ralstonia solanacearum CFBP2957 plasmid RCFBPv3_mp, complete genome) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

60. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to CP023013 (Ralstonia solanacearum strain T110 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

61. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP021653 (Ralstonia solanacearum strain RS 488 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

62. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NC_014310 (Ralstonia solanacearum PSI07 plasmid mpPSI07, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

63. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP022762 (Ralstonia solanacearum strain T95 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

64. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP049790 (Ralstonia solanacearum strain 202 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

65. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP020716 (Cnuibacter physcomitrellae strain XA(T) plasmid unnamed1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
gccccttgccgcggtggcggctgcccagta	Protospacer
* ..*********.******* ******

66. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP022766 (Ralstonia solanacearum strain T78 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

67. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP021763 (Ralstonia pseudosolanacearum strain RS 476 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

68. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP026093 (Ralstonia solanacearum strain SFC plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

69. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP021767 (Ralstonia solanacearum strain RS 489 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

70. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP015116 (Ralstonia solanacearum strain EP1 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

71. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP016555 (Ralstonia solanacearum FJAT-1458 plasmid plas1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

72. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP012688 (Ralstonia solanacearum strain UY031 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

73. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP052069 (Ralstonia solanacearum strain FJAT91.F50 plasmid Plas1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

74. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP016915 (Ralstonia solanacearum strain CQPS-1 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

75. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP016905 (Ralstonia solanacearum strain KACC 10709 plasmid unnamed1) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

76. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP025986 (Ralstonia solanacearum strain RSCM plasmid p-unname2, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

77. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP022769 (Ralstonia solanacearum strain T60 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

78. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP023017 (Ralstonia solanacearum strain SL3022 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

79. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NC_017585 (Streptomyces cattleya NRRL 8057 = DSM 46488 plasmid pSCATT, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
ccggcgtgccgcggtggcggcggccccggc	Protospacer
    * *******.************ ***

80. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NC_017585 (Streptomyces cattleya NRRL 8057 = DSM 46488 plasmid pSCATT, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
gccgccggccgcgatggtgggggcccaggc	Protospacer
* . *. **********.** *********

81. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP022773 (Ralstonia solanacearum strain T42 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

82. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP022783 (Ralstonia solanacearum strain SL3755 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

83. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP014703 (Ralstonia solanacearum strain KACC 10722 plasmid, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

84. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP022760 (Ralstonia solanacearum strain T98 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

85. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP022789 (Ralstonia solanacearum strain SL3175 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

86. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP022795 (Ralstonia solanacearum strain SL2330 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

87. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP052071 (Ralstonia solanacearum strain FJAT454.F1 plasmid Plas1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

88. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NC_017575 (Ralstonia solanacearum Po82 megaplasmid, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

89. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP022771 (Ralstonia solanacearum strain T51 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

90. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP022777 (Ralstonia solanacearum strain T11 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

91. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP022799 (Ralstonia solanacearum strain SL2064 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

92. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP009763 (Ralstonia solanacearum OE1-1 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

93. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to CP023015 (Ralstonia solanacearum strain T25 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgtaccaggc	Protospacer
 ...* ****************  ******

94. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP022779 (Ralstonia solanacearum strain SL3882 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

95. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP052075 (Ralstonia solanacearum strain FJAT448.F1 plasmid Plas1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

96. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP052085 (Ralstonia solanacearum strain FJAT15353.F8 plasmid Plas1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

97. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP052095 (Ralstonia solanacearum strain FJAT15340.F1 plasmid Plas1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

98. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP052105 (Ralstonia solanacearum strain FJAT15252.F1 plasmid Plas1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

99. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP026308 (Ralstonia solanacearum strain IBSBF 2571 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

100. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP021765 (Ralstonia pseudosolanacearum strain CRMRs218 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

101. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP052077 (Ralstonia solanacearum strain FJAT445.F50 plasmid Plas1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

102. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP052087 (Ralstonia solanacearum strain FJAT15353.F50 plasmid Plas1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

103. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP052097 (Ralstonia solanacearum strain FJAT15304.F6 plasmid Plas1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

104. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP052115 (Ralstonia solanacearum strain FJAT1463.F50 plasmid Plas1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

105. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP052127 (Ralstonia solanacearum strain FJAT1303.F50 plasmid Plas1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

106. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP052079 (Ralstonia solanacearum strain FJAT445.F1 plasmid Plas1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

107. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP052089 (Ralstonia solanacearum strain FJAT15353.F1 plasmid Plas1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

108. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP052093 (Ralstonia solanacearum strain FJAT15340.F50 plasmid Plas1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

109. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP052101 (Ralstonia solanacearum strain FJAT15304.F1 plasmid Plas1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

110. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP052099 (Ralstonia solanacearum strain FJAT15304.F50 plasmid Plas1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

111. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP052107 (Ralstonia solanacearum strain FJAT15249.F50 plasmid Plas1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

112. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP022781 (Ralstonia solanacearum strain SL3822 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

113. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP052117 (Ralstonia solanacearum strain FJAT1463.F1 plasmid Plas1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

114. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP052125 (Ralstonia solanacearum strain FJAT1452.F1 plasmid Plas1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

115. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP022793 (Ralstonia solanacearum strain SL2729 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

116. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP022785 (Ralstonia solanacearum strain SL3730 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

117. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP022787 (Ralstonia solanacearum strain SL3300 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

118. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP022756 (Ralstonia solanacearum strain T117 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

119. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP052129 (Ralstonia solanacearum strain FJAT1303.F1 plasmid Plas1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

120. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP052121 (Ralstonia solanacearum strain FJAT1458.F1 plasmid Plas1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

121. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP052123 (Ralstonia solanacearum strain FJAT1452.F50 plasmid Plas1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

122. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP052131 (Ralstonia solanacearum strain FJAT1303.F8 plasmid Plas1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

123. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to CP011998 (Ralstonia solanacearum strain YC45 plasmid, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

124. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP052073 (Ralstonia solanacearum strain FJAT448.F50 plasmid Plas1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

125. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP052081 (Ralstonia solanacearum strain FJAT442.F50 plasmid Plas1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

126. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP052083 (Ralstonia solanacearum strain FJAT442.F1 plasmid Plas1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

127. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP052109 (Ralstonia solanacearum strain FJAT15249.F1 plasmid Plas1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

128. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP052091 (Ralstonia solanacearum strain FJAT15340.F6 plasmid Plas1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

129. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP052111 (Ralstonia solanacearum strain FJAT15244.F50 plasmid Plas1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

130. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP052103 (Ralstonia solanacearum strain FJAT15252.F50 plasmid Plas1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

131. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP052119 (Ralstonia solanacearum strain FJAT1458.F50 plasmid Plas1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

132. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP052113 (Ralstonia solanacearum strain FJAT15244.F1 plasmid Plas1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tgcccatgccgcgatggcggcgcaccaggc	Protospacer
 ...* ****************  ******

133. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to MT316461 (Streptomyces phage Galactica, complete genome) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
ggccggtgccgcgaaggcggcggccaaggc	Protospacer
*...  ******** ********** ****

134. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP012477 (Arthrobacter sp. ERGS1:01 isolate water plasmid unnamed2, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
ctttgccgccgcgatcgcggcggccgaggc	Protospacer
  ** ..******** ********* ****

135. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_AP014705 (Methylobacterium aquaticum strain MA-22A plasmid pMaq22A_1p, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
ggtcggcgacgcgatggcggcggccgaggc	Protospacer
*.*.  .* **************** ****

136. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to MN284893 (Mycobacterium phage LilMcDreamy, complete genome) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
ggtcgaggccgcgatggcggcggcgctggc	Protospacer
*.*.   ***************** * ***

137. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP019036 (Massilia putida strain 6NM-7 plasmid unnamed1, complete sequence) position: , mismatch: 7, identity: 0.767

gattc---ttgccgcgatggcggcggcccaggc	CRISPR spacer
---tcagacggccgcgctggcggcggcgcaggc	Protospacer
   **   . ****** ********** *****

138. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NC_023316 (Streptomyces sp. 14R-10 plasmid pZL1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
gccgctggccgcgatggcggcggccgtgcc	Protospacer
* . ** ******************  * *

139. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP025016 (Rhizobium leguminosarum strain Norway plasmid pRLN4, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
gctggaagccgcgattgcggcggcccgggc	Protospacer
* *    ******** **********.***

140. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_LR134452 (Tsukamurella tyrosinosolvens strain NCTC13231 plasmid 10, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
cacgcgcgccgcgaaggcggcggccgaggc	Protospacer
 *. * .******* ********** ****

141. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to CP053919 (Serratia marcescens strain LY1 plasmid unnamed1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
ggtgaacgccgcgaaggcggcggaccaggc	Protospacer
*.*   .******* ******** ******

142. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to CP053919 (Serratia marcescens strain LY1 plasmid unnamed1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
ggtgaacgccgcgaaggcggcggaccaggc	Protospacer
*.*   .******* ******** ******

143. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to CP053919 (Serratia marcescens strain LY1 plasmid unnamed1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
ggtgaacgccgcgaaggcggcggaccaggc	Protospacer
*.*   .******* ******** ******

144. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to CP053919 (Serratia marcescens strain LY1 plasmid unnamed1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
ggtgaacgccgcgaaggcggcggaccaggc	Protospacer
*.*   .******* ******** ******

145. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to CP053919 (Serratia marcescens strain LY1 plasmid unnamed1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
ggtgaacgccgcgaaggcggcggaccaggc	Protospacer
*.*   .******* ******** ******

146. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to CP053919 (Serratia marcescens strain LY1 plasmid unnamed1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
ggtgaacgccgcgaaggcggcggaccaggc	Protospacer
*.*   .******* ******** ******

147. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to CP053919 (Serratia marcescens strain LY1 plasmid unnamed1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
ggtgaacgccgcgaaggcggcggaccaggc	Protospacer
*.*   .******* ******** ******

148. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to CP053919 (Serratia marcescens strain LY1 plasmid unnamed1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
ggtgaacgccgcgaaggcggcggaccaggc	Protospacer
*.*   .******* ******** ******

149. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to CP053919 (Serratia marcescens strain LY1 plasmid unnamed1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
ggtgaacgccgcgaaggcggcggaccaggc	Protospacer
*.*   .******* ******** ******

150. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to CP053919 (Serratia marcescens strain LY1 plasmid unnamed1, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
ggtgaacgccgcgaaggcggcggaccaggc	Protospacer
*.*   .******* ******** ******

151. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP022363 (Azospirillum sp. TSH58 plasmid TSH58_p03, complete sequence) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
caccgtcgccgcgatggcggcggccggggc	Protospacer
 *.. *.****************** .***

152. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to JN564907 (Burkholderia phage AH2, complete genome) position: , mismatch: 7, identity: 0.767

gattctt----gccgcgatggcggcggcccaggc	CRISPR spacer
----cctgaaggccgcgatggcgtcggccgaggc	Protospacer
    *.*    ************ ***** ****

153. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to MN813697 (Mycobacterium phage Noelle, complete genome) position: , mismatch: 7, identity: 0.767

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
cttcatcgccgcgacggcggcgtcccaggc	Protospacer
  *. *.*******.******* *******

154. spacer 3.3|1616752|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP014683 (Kozakia baliensis strain NBRC 16680 plasmid pKB16680_2, complete sequence) position: , mismatch: 8, identity: 0.733

cctatgtccgtaacaacccggacgtggccg	CRISPR spacer
cctatgtccgtaataacacggacaagtgga	Protospacer
*************.*** *****. *   .

155. spacer 3.9|1617148|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to MN034485 (Leviviridae sp. isolate H2_Bulk_34_354 hypothetical protein (H2Bulk34354_000001) gene, partial cds; and hypothetical protein (H2Bulk34354_000002) and RNA-dependent RNA polymerase (H2Bulk34354_000003) genes, complete cds) position: , mismatch: 8, identity: 0.733

ccttccacgcgtcaagctcaccttcgaacc--	CRISPR spacer
tattccaggcgtcaagctcacct--agatcag	Protospacer
. ***** ***************  ..*.*

156. spacer 3.11|1617280|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NC_019410 (Caulobacter phage CcrKarma, complete genome) position: , mismatch: 8, identity: 0.733

cgcggcgagacccacgtcaacaacctgctg	CRISPR spacer
accctgaagacccaggtcaacaatctgctg	Protospacer
  *   .******* ********.******

157. spacer 3.11|1617280|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NC_019407 (Caulobacter phage CcrMagneto, complete genome) position: , mismatch: 8, identity: 0.733

cgcggcgagacccacgtcaacaacctgctg	CRISPR spacer
accctgaagacccaggtcaacaccctgctg	Protospacer
  *   .******* ******* *******

158. spacer 3.11|1617280|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to KY555144 (Caulobacter phage Ccr5, complete genome) position: , mismatch: 8, identity: 0.733

cgcggcgagacccacgtcaacaacctgctg	CRISPR spacer
accctgaagacccaggtcaacaccctgctg	Protospacer
  *   .******* ******* *******

159. spacer 3.11|1617280|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NC_019411 (Caulobacter phage CcrSwift, complete genome) position: , mismatch: 8, identity: 0.733

cgcggcgagacccacgtcaacaacctgctg	CRISPR spacer
accctgaagacccaggtcaacaatctgctg	Protospacer
  *   .******* ********.******

160. spacer 3.12|1617346|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP047174 (Rathayibacter sp. VKM Ac-2760 plasmid unnamed1, complete sequence) position: , mismatch: 8, identity: 0.733

gcccatcccgagctcgcgcttgtagcgcat	CRISPR spacer
gtcggggccgagcttgcgcttgtagcgcgc	Protospacer
*.* .  *******.*************..

161. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NC_018022 (Mycolicibacterium chubuense NBB4 plasmid pMYCCH.01, complete sequence) position: , mismatch: 8, identity: 0.733

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
cgcggatgccgcgatggccgcgacccaggc	Protospacer
 ..   ************ ***.*******

162. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP039340 (Ralstonia solanacearum strain UW386 plasmid pUW386, complete sequence) position: , mismatch: 8, identity: 0.733

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
cgctaacgccgcggcggcggcggcccaggc	Protospacer
 ..*  .******..***************

163. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NC_015583 (Novosphingobium sp. PP1Y plasmid Mpl, complete sequence) position: , mismatch: 8, identity: 0.733

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
ctatcttgacgcgatggcggcggccgggct	Protospacer
   ***** **************** .* .

164. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP050083 (Rhizobium leguminosarum bv. trifolii strain 31B plasmid pRL31b3, complete sequence) position: , mismatch: 8, identity: 0.733

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
ccgtctttccgcgatggcggcgggccgctc	Protospacer
   **** *************** **.  *

165. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NC_012811 (Methylorubrum extorquens AM1 megaplasmid, complete sequence) position: , mismatch: 8, identity: 0.733

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
gccgagcgcctcgatggcggcggcgcaggc	Protospacer
* .   .*** ************* *****

166. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NC_012586 (Sinorhizobium fredii NGR234 plasmid pNGR234b, complete sequence) position: , mismatch: 8, identity: 0.733

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
atatagggccgcgttgccggcggcccaggc	Protospacer
.  *   ****** ** *************

167. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP049733 (Rhizobium leguminosarum strain A1 plasmid pRL10, complete sequence) position: , mismatch: 8, identity: 0.733

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
ccgtctttccgcgatggcggcgggccgctc	Protospacer
   **** *************** **.  *

168. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP024310 (Sinorhizobium fredii strain NXT3 plasmid pSfreNXT3c, complete sequence) position: , mismatch: 8, identity: 0.733

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
caaggctgccgcgatggcggccgaccagga	Protospacer
 *   .*************** * *****

169. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP045120 (Rubrobacter sp. SCSIO 52909 plasmid unnamed1, complete sequence) position: , mismatch: 8, identity: 0.733

-----gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
ccaaagg-----gccgcgagggcgccggcccaggc	Protospacer
     *.     ******* **** **********

170. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP023064 (Sinorhizobium sp. CCBAU 05631 plasmid pSS05631b, complete sequence) position: , mismatch: 8, identity: 0.733

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
caaggctgccgcgatggcggccgaccagga	Protospacer
 *   .*************** * *****

171. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_LR594663 (Variovorax sp. RA8 plasmid 2) position: , mismatch: 8, identity: 0.733

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
gccgccgagcgcgatggcggcggccccggc	Protospacer
* . *. . ***************** ***

172. spacer 3.15|1617544|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP015092 (Pelagibaca abyssi strain JLT2014 plasmid pPABY3, complete sequence) position: , mismatch: 8, identity: 0.733

cccccagggcgcatagccaagccggcccac	CRISPR spacer
ggggcagggcgcatagccatgccagccctg	Protospacer
    *************** ***.****

173. spacer 3.15|1617544|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP049032 (Fluviibacterium aquatile strain SC52 plasmid pSC52_4, complete sequence) position: , mismatch: 8, identity: 0.733

cccccagggcgcatagccaagccggcccac	CRISPR spacer
ggggcagggcgcatagccatgccagccctg	Protospacer
    *************** ***.****

174. spacer 3.15|1617544|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP031601 (Roseovarius indicus strain DSM 26383 plasmid pRIdsm_03, complete sequence) position: , mismatch: 8, identity: 0.733

cccccagggcgcatagccaagccggcccac	CRISPR spacer
ggggcagggcgcatagccatgccagccctg	Protospacer
    *************** ***.****

175. spacer 3.15|1617544|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP004395 (Celeribacter indicus strain P73 plasmid pP73B, complete sequence) position: , mismatch: 8, identity: 0.733

cccccagggcgcatagccaagccggcccac	CRISPR spacer
ggggcagggcgcatagccatgccagccctg	Protospacer
    *************** ***.****

176. spacer 3.19|1617822|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 8, identity: 0.733

ccagcggacggacgcatatgggcaagcggc	CRISPR spacer
ccagcggacggacgcatacggcggcccgat	Protospacer
******************.**  .  **..

177. spacer 3.21|1617954|31|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_LR594668 (Variovorax sp. SRS16 plasmid 3) position: , mismatch: 8, identity: 0.742

tccttttacgcgatgagggcagtgagcccgg	CRISPR spacer
tgcagcgccgcgaagagcgcagtgagcccgg	Protospacer
* *  .  ***** *** *************

178. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP049794 (Ralstonia solanacearum strain 204 plasmid unnamed, complete sequence) position: , mismatch: 9, identity: 0.7

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
atcggacggcgcgatggcggcggccgaggc	Protospacer
. .   .* **************** ****

179. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP049792 (Ralstonia solanacearum strain 203 plasmid unnamed, complete sequence) position: , mismatch: 9, identity: 0.7

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
atcggacggcgcgatggcggcggccgaggc	Protospacer
. .   .* **************** ****

180. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP049790 (Ralstonia solanacearum strain 202 plasmid unnamed, complete sequence) position: , mismatch: 9, identity: 0.7

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
atcggacggcgcgatggcggcggccgaggc	Protospacer
. .   .* **************** ****

181. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP016915 (Ralstonia solanacearum strain CQPS-1 plasmid unnamed, complete sequence) position: , mismatch: 9, identity: 0.7

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
atcggacggcgcgatggcggcggccgaggc	Protospacer
. .   .* **************** ****

182. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP052085 (Ralstonia solanacearum strain FJAT15353.F8 plasmid Plas1, complete sequence) position: , mismatch: 9, identity: 0.7

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
atcggacggcgcgatggcggcggccgaggc	Protospacer
. .   .* **************** ****

183. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP052087 (Ralstonia solanacearum strain FJAT15353.F50 plasmid Plas1, complete sequence) position: , mismatch: 9, identity: 0.7

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
atcggacggcgcgatggcggcggccgaggc	Protospacer
. .   .* **************** ****

184. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP052127 (Ralstonia solanacearum strain FJAT1303.F50 plasmid Plas1, complete sequence) position: , mismatch: 9, identity: 0.7

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
atcggacggcgcgatggcggcggccgaggc	Protospacer
. .   .* **************** ****

185. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP052089 (Ralstonia solanacearum strain FJAT15353.F1 plasmid Plas1, complete sequence) position: , mismatch: 9, identity: 0.7

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
atcggacggcgcgatggcggcggccgaggc	Protospacer
. .   .* **************** ****

186. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP052131 (Ralstonia solanacearum strain FJAT1303.F8 plasmid Plas1, complete sequence) position: , mismatch: 9, identity: 0.7

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
atcggacggcgcgatggcggcggccgaggc	Protospacer
. .   .* **************** ****

187. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_AP022593 (Mycolicibacterium arabiense strain JCM 18538 plasmid pJCM18538, complete sequence) position: , mismatch: 9, identity: 0.7

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
cggcgacgtcgcggtggcggcggcccaggc	Protospacer
 . .  .*.****.****************

188. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP021813 (Sinorhizobium meliloti strain M270 plasmid psymA, complete sequence) position: , mismatch: 9, identity: 0.7

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
cgcgaaagccgcgatcgcggcggccaaggc	Protospacer
 ..    ******** ********* ****

189. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP045074 (Paracoccus kondratievae strain BJQ0001 plasmid unnamed1, complete sequence) position: , mismatch: 9, identity: 0.7

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
tccagtcgccgcgatggcggcggaccagat	Protospacer
  .  *.**************** ****..

190. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NZ_CP021819 (Sinorhizobium meliloti strain M162 plasmid psymA, complete sequence) position: , mismatch: 9, identity: 0.7

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
cgcgaaagccgcgatcgcggcggccaaggc	Protospacer
 ..    ******** ********* ****

191. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NC_020548 (Azoarcus sp. KH32C plasmid pAZKH, complete sequence) position: , mismatch: 9, identity: 0.7

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
ccgcgcggcctcggtggcggcggcccaggc	Protospacer
   . . *** **.****************

192. spacer 3.13|1617412|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NC_009620 (Sinorhizobium medicae WSM419 plasmid pSMED01, complete sequence) position: , mismatch: 9, identity: 0.7

gattcttgccgcgatggcggcggcccaggc	CRISPR spacer
cgcgaaagccgcgattgcggcggccaaggc	Protospacer
 ..    ******** ********* ****

193. spacer 3.14|1617478|30|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to NC_000914 (Sinorhizobium fredii NGR234 plasmid pNGR234a, complete sequence) position: , mismatch: 9, identity: 0.7

actcgctgcgaggggacggggagaggaagg	CRISPR spacer
tgtgcctgcgaggggaaggggagaggcgcc	Protospacer
  *  *********** ********* .

194. spacer 3.21|1617954|31|NC_020561|CRISPRCasFinder,CRT,PILER-CR matches to MN035828 (Leviviridae sp. isolate H3_Bulk_Litter_17_scaffold_1122 RNA-dependent RNA polymerase (H3BulkLitter171122_000001) and hypothetical protein (H3BulkLitter171122_000002) genes, complete cds; and hypothetical protein (H3BulkLitter171122_000003) gene, partial cds) position: , mismatch: 9, identity: 0.71

tccttttacgcgatgagggcagtgagcccgg	CRISPR spacer
ccgaagaacgccatgcgggcagtgagcccga	Protospacer
.*     **** *** **************.

Prophage detection

Region

Region Position

Protein_number

Hit_taxonomy

Key_proteins

Att_site

Prophage annotation

DBSCAN-SWA_1

641969 : 650998

Tupanvirus(16.67%)

The bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_051128789.1\|641969_643436_-	acyl-CoA ligase (AMP-forming), exosortase A system-associated	A0A2K9KZV5	Tupanvirus	3.9e-19	23.3
WP_015457347.1\|643631_643907_+	hypothetical protein	NA	NA	NA	NA
WP_187294048.1\|643927_644875_-	thioredoxin-disulfide reductase	A0A2I2L5E1	Orpheovirus	2.3e-65	43.9
WP_015457349.1\|645303_645576_-	HU family DNA-binding protein	Q6QIE5	Burkholderia_phage	4.2e-20	60.7
WP_015457350.1\|645803_648203_-	endopeptidase La	A0A0R6PGP8	Moraxella_phage	7.7e-206	49.2
WP_015457351.1\|648417_648978_-	TIGR00645 family protein	K4K6D8	Caulobacter_phage	4.2e-22	32.6
WP_015457352.1\|649107_649407_-	GIY-YIG nuclease family protein	NA	NA	NA	NA
WP_015457353.1\|649486_650998_-	replicative DNA helicase	A0A1P8VVQ6	Streptococcus_phage	1.7e-73	38.0

DBSCAN-SWA_2

1047135 : 1072457

Rhizobium_phage(30.77%)

head,portal,integrase,capsid,protease,terminase

attL 1043612:1043628|attR 1061164:1061180

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
1043612:1043628	attL	NA	NA	NA	NA
WP_015457739.1\|1047135_1048584_+\|integrase	integrase arm-type DNA-binding domain-containing protein	A0A2L0V119	Agrobacterium_phage	1.0e-80	40.2
WP_015457740.1\|1048580_1048820_-	AlpA family phage regulatory protein	NA	NA	NA	NA
WP_144062106.1\|1048834_1049197_-	thermonuclease family protein	NA	NA	NA	NA
WP_015457742.1\|1049390_1049744_-	hypothetical protein	NA	NA	NA	NA
WP_015457743.1\|1049736_1049922_-	hypothetical protein	NA	NA	NA	NA
WP_015457744.1\|1049921_1050485_-	hypothetical protein	NA	NA	NA	NA
WP_015457745.1\|1050484_1050739_-	hypothetical protein	NA	NA	NA	NA
WP_144061989.1\|1050693_1051089_-	hypothetical protein	NA	NA	NA	NA
WP_015457746.1\|1051085_1051676_-	hypothetical protein	NA	NA	NA	NA
WP_015457747.1\|1051672_1052824_-	DNA cytosine methyltransferase	A0A218M957	Mycobacterium_phage	1.6e-20	34.9
WP_144061990.1\|1052823_1053177_-	hypothetical protein	NA	NA	NA	NA
WP_015457749.1\|1053173_1053650_-	hypothetical protein	A0A2D1GMW7	Marinobacter_phage	1.3e-32	52.5
WP_187294030.1\|1053643_1053784_-	hypothetical protein	NA	NA	NA	NA
WP_144061991.1\|1053780_1054452_-	hypothetical protein	NA	NA	NA	NA
WP_187294031.1\|1054448_1054625_-	hypothetical protein	NA	NA	NA	NA
WP_015457752.1\|1054783_1054987_-	hypothetical protein	NA	NA	NA	NA
WP_015457753.1\|1054986_1055175_-	hypothetical protein	NA	NA	NA	NA
WP_015457754.1\|1055171_1056080_-	hypothetical protein	NA	NA	NA	NA
WP_144061992.1\|1056231_1057062_+	hypothetical protein	NA	NA	NA	NA
WP_187294032.1\|1057044_1057767_-	helix-turn-helix domain-containing protein	NA	NA	NA	NA
WP_015457757.1\|1057785_1058040_+	helix-turn-helix transcriptional regulator	NA	NA	NA	NA
WP_015457758.1\|1058174_1058456_+	hypothetical protein	NA	NA	NA	NA
WP_015457759.1\|1058457_1058649_-	hypothetical protein	NA	NA	NA	NA
WP_015457760.1\|1058877_1059384_+	hypothetical protein	NA	NA	NA	NA
WP_144061993.1\|1059432_1060062_+	DNA methyltransferase	M4SPS7	Rhodobacter_phage	5.7e-44	47.2
WP_015457762.1\|1060061_1060757_+	hypothetical protein	NA	NA	NA	NA
WP_015457763.1\|1060786_1061023_+	DUF2312 domain-containing protein	B0VK10	Azospirillum_phage	2.5e-16	56.2
WP_041864799.1\|1061025_1061235_+	hypothetical protein	NA	NA	NA	NA
1061164:1061180	attR	NA	NA	NA	NA
WP_015457764.1\|1061231_1061444_+	hypothetical protein	NA	NA	NA	NA
WP_144061994.1\|1061440_1062184_+	hypothetical protein	M9Q2G6	Clostridium_phage	2.0e-11	36.2
WP_041864800.1\|1062146_1062716_+	hypothetical protein	NA	NA	NA	NA
WP_041864801.1\|1062763_1063375_+	hypothetical protein	NA	NA	NA	NA
WP_015457768.1\|1063682_1063964_-	putative addiction module antidote protein	A0A141GEX5	Brucella_phage	8.8e-21	54.9
WP_015457769.1\|1063966_1064263_-	type II toxin-antitoxin system RelE/ParE family toxin	A0A141GEX6	Brucella_phage	9.9e-23	54.2
WP_015457770.1\|1064446_1064650_+	hypothetical protein	NA	NA	NA	NA
WP_041864802.1\|1064753_1065074_+	HNH endonuclease	NA	NA	NA	NA
WP_015457772.1\|1065189_1065609_+	hypothetical protein	NA	NA	NA	NA
WP_084673621.1\|1065550_1067446_+\|terminase	terminase large subunit	A0A0U4B0M7	Pseudomonas_phage	6.3e-94	36.9
WP_015457774.1\|1067442_1068708_+\|portal	phage portal protein	B4UTP1	Rhizobium_phage	3.9e-124	59.1
WP_015457775.1\|1068664_1069261_+\|head,protease	HK97 family phage prohead protease	B4UTP2	Rhizobium_phage	1.2e-43	53.0
WP_015457776.1\|1069350_1070640_+\|capsid	phage major capsid protein	B4UTP3	Rhizobium_phage	1.6e-138	61.7
WP_144061995.1\|1070706_1070898_+	hypothetical protein	B4UTP6	Rhizobium_phage	1.7e-07	55.9
WP_015457778.1\|1070904_1071528_+	hypothetical protein	NA	NA	NA	NA
WP_015457779.1\|1071531_1072128_+	hypothetical protein	NA	NA	NA	NA
WP_015457780.1\|1072124_1072457_+\|head	phage head closure protein	NA	NA	NA	NA

DBSCAN-SWA_3

1874484 : 1924690

Pseudomonas_phage(18.18%)

head,portal,capsid,tail,protease,terminase

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_015458541.1\|1874484_1874805_+\|protease	ATP-dependent Clp protease adapter ClpS	A0A1B1IT64	uncultured_Mediterranean_phage	4.5e-13	47.4
WP_187294056.1\|1875067_1875595_-	CHAP domain-containing protein	NA	NA	NA	NA
WP_015458543.1\|1875730_1877035_-	amidohydrolase family protein	NA	NA	NA	NA
WP_015458544.1\|1877182_1877464_+	DUF3297 family protein	NA	NA	NA	NA
WP_015458545.1\|1877633_1878176_+	hypothetical protein	NA	NA	NA	NA
WP_015458546.1\|1878262_1879588_-	MFS transporter	NA	NA	NA	NA
WP_041864857.1\|1879837_1881010_+	ubiquinol oxidase subunit II	NA	NA	NA	NA
WP_015458548.1\|1881045_1883049_+	cytochrome o ubiquinol oxidase subunit I	NA	NA	NA	NA
WP_015458549.1\|1883053_1883686_+	cytochrome o ubiquinol oxidase subunit III	NA	NA	NA	NA
WP_015458550.1\|1883682_1884078_+	cytochrome o ubiquinol oxidase subunit IV	NA	NA	NA	NA
WP_107394679.1\|1884155_1884860_+	SURF1 family protein	NA	NA	NA	NA
WP_015458552.1\|1884856_1886194_+	HAMP domain-containing histidine kinase	NA	NA	NA	NA
WP_015458553.1\|1886190_1886727_+	response regulator transcription factor	NA	NA	NA	NA
WP_015458554.1\|1886896_1888819_+	1-deoxy-D-xylulose-5-phosphate synthase	NA	NA	NA	NA
WP_015458555.1\|1888815_1889241_+	DUF2141 domain-containing protein	NA	NA	NA	NA
WP_015458556.1\|1889273_1891865_+	MMPL family transporter	NA	NA	NA	NA
WP_015458557.1\|1891855_1892449_-	ABC transporter substrate-binding protein	NA	NA	NA	NA
WP_015458558.1\|1892626_1893586_+	4-hydroxy-3-methylbut-2-enyl diphosphate reductase	NA	NA	NA	NA
WP_015458559.1\|1893591_1894743_+	adenosyl-hopene transferase HpnH	NA	NA	NA	NA
WP_144062128.1\|1894771_1896109_-	amidohydrolase family protein	NA	NA	NA	NA
WP_015458561.1\|1896108_1896744_-	hopanoid-associated phosphorylase	NA	NA	NA	NA
WP_015458562.1\|1896740_1898720_-	squalene--hopene cyclase	NA	NA	NA	NA
WP_015458563.1\|1898706_1899969_-	FAD-dependent oxidoreductase	NA	NA	NA	NA
WP_015458564.1\|1899976_1900810_-	presqualene diphosphate synthase HpnD	NA	NA	NA	NA
WP_051128721.1\|1900806_1901685_-	squalene synthase HpnC	NA	NA	NA	NA
WP_015458566.1\|1901681_1902818_-	glycosyltransferase	NA	NA	NA	NA
WP_015458567.1\|1902814_1903819_-	NAD-dependent epimerase/dehydratase family protein	A0A2C9DTC1	Eastern_grey_kangaroopox_virus	2.4e-07	27.0
WP_144062129.1\|1903906_1905004_+	bacteriohopanetetrol glucosamine biosynthesis glycosyltransferase HpnI	NA	NA	NA	NA
WP_041864858.1\|1905003_1906428_+	hopanoid biosynthesis associated radical SAM protein HpnJ	NA	NA	NA	NA
WP_084653392.1\|1906442_1907417_+	hopanoid biosynthesis-associated protein HpnK	NA	NA	NA	NA
WP_015458571.1\|1907416_1908292_+	hypothetical protein	NA	NA	NA	NA
WP_051128819.1\|1908315_1909272_+	flippase-like domain-containing protein	NA	NA	NA	NA
WP_015458573.1\|1909284_1911108_-	elongation factor 4	E4ZFJ7	Streptococcus_phage	1.0e-21	23.3
WP_041865292.1\|1911296_1912046_+	protein involved in formation of curli polymers	NA	NA	NA	NA
WP_015458575.1\|1912088_1913099_-	inorganic phosphate transporter	E5ESL8	Bathycoccus_sp._RCC1105_virus	2.6e-14	30.4
WP_041864859.1\|1913117_1914230_-	DUF47 family protein	S5VM37	Pseudomonas_phage	2.1e-12	37.8
WP_015458577.1\|1914370_1915678_+	FAD-dependent oxidoreductase	NA	NA	NA	NA
WP_015458578.1\|1916070_1916808_+	helix-turn-helix domain-containing protein	A0A1B0YZZ0	Pseudomonas_phage	1.4e-12	46.0
WP_015458580.1\|1917506_1917902_+	HNH endonuclease	A0A2K5B276	Erysipelothrix_phage	3.3e-05	38.8
WP_144062130.1\|1917987_1919487_+\|terminase	terminase large subunit	B4UTP0	Rhizobium_phage	6.5e-78	37.7
WP_015458582.1\|1919483_1919708_-	hypothetical protein	NA	NA	NA	NA
WP_084673637.1\|1919700_1920009_-	hypothetical protein	NA	NA	NA	NA
WP_015458584.1\|1920285_1920699_+	hypothetical protein	NA	NA	NA	NA
WP_015458585.1\|1920789_1921290_+	MerR family transcriptional regulator	NA	NA	NA	NA
WP_015458586.1\|1921450_1922674_+\|capsid	phage major capsid protein	D6PFE3	uncultured_phage	2.6e-32	31.9
WP_144062131.1\|1922691_1923216_+\|head,protease	HK97 family phage prohead protease	A0A2K9VGN9	Pontimonas_phage	5.1e-30	52.2
WP_015458588.1\|1923206_1924364_+\|portal	phage portal protein	Q6JIM9	Burkholderia_virus	7.8e-47	35.3
WP_015458589.1\|1924363_1924690_+\|head,tail	phage gp6-like head-tail connector protein	NA	NA	NA	NA

DBSCAN-SWA_4

2554304 : 2607859

Lactococcus_phage(23.08%)

transposase,integrase

attL 2600640:2600657|attR 2605969:2605986

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_015449228.1\|2554304_2555822_+\|transposase	IS21 family transposase	A0A2L1IVA1	Escherichia_phage	4.8e-12	26.2
WP_015449229.1\|2555808_2556537_+	ATP-binding protein	A0A059NT77	Lactococcus_phage	5.6e-35	39.3
WP_015459149.1\|2556664_2557237_-	DUF1156 domain-containing protein	NA	NA	NA	NA
WP_015459150.1\|2557236_2557803_-	DUF3780 domain-containing protein	A0A1P8DTE9	Proteus_phage	1.6e-29	43.2
WP_015459151.1\|2557842_2560947_-	DUF499 domain-containing protein	NA	NA	NA	NA
WP_015459152.1\|2560962_2561238_-	hypothetical protein	NA	NA	NA	NA
WP_144062144.1\|2561395_2561971_+	DUF4231 domain-containing protein	NA	NA	NA	NA
WP_015459154.1\|2561970_2563512_+	nucleotidyltransferase	NA	NA	NA	NA
WP_015459155.1\|2563532_2564417_+	nucleotidyltransferase	NA	NA	NA	NA
WP_015459156.1\|2564456_2564936_-	ATP-binding domain-containing protein	NA	NA	NA	NA
WP_015449228.1\|2565059_2566577_+\|transposase	IS21 family transposase	A0A2L1IVA1	Escherichia_phage	4.8e-12	26.2
WP_015449229.1\|2566563_2567292_+	ATP-binding protein	A0A059NT77	Lactococcus_phage	5.6e-35	39.3
WP_187293999.1\|2567426_2569658_-	DNA helicase UvrD	NA	NA	NA	NA
WP_015459158.1\|2569851_2570052_-	hypothetical protein	NA	NA	NA	NA
WP_015459159.1\|2570279_2571143_-	DNA/RNA non-specific endonuclease	NA	NA	NA	NA
WP_041864900.1\|2571154_2572594_-	DUF2235 domain-containing protein	NA	NA	NA	NA
WP_015459161.1\|2572712_2573936_-	hypothetical protein	NA	NA	NA	NA
WP_015459162.1\|2574486_2575359_+	hypothetical protein	NA	NA	NA	NA
WP_041864902.1\|2575466_2575556_+	K(+)-transporting ATPase subunit F	NA	NA	NA	NA
WP_015459163.1\|2575569_2577273_+	potassium-transporting ATPase subunit KdpA	NA	NA	NA	NA
WP_015459164.1\|2577287_2579339_+	potassium-transporting ATPase subunit KdpB	M1HX51	Paramecium_bursaria_Chlorella_virus	2.7e-26	24.3
WP_015459165.1\|2579351_2579924_+	potassium-transporting ATPase subunit KdpC	NA	NA	NA	NA
WP_187294061.1\|2579929_2582590_+	sensor histidine kinase KdpD	W8CYF6	Bacillus_phage	4.0e-14	24.8
WP_015459167.1\|2582594_2583275_+	response regulator transcription factor	NA	NA	NA	NA
WP_015459168.1\|2583646_2583946_-	winged helix-turn-helix transcriptional regulator	NA	NA	NA	NA
WP_144062145.1\|2584301_2584907_+	hypothetical protein	NA	NA	NA	NA
WP_015459170.1\|2585018_2585900_+	DNA polymerase III subunit epsilon	NA	NA	NA	NA
WP_144062146.1\|2585994_2586762_+	hypothetical protein	NA	NA	NA	NA
WP_015459172.1\|2586764_2587544_+	hypothetical protein	NA	NA	NA	NA
WP_041864904.1\|2587540_2588197_+	hypothetical protein	NA	NA	NA	NA
WP_015459174.1\|2588327_2588702_+	hypothetical protein	NA	NA	NA	NA
WP_015459175.1\|2588715_2589663_+	hypothetical protein	S5VKI3	Leptospira_phage	2.8e-42	35.6
WP_015459176.1\|2589659_2590517_+	hypothetical protein	NA	NA	NA	NA
WP_015459177.1\|2591008_2592196_+\|integrase	integrase family protein	NA	NA	NA	NA
WP_015459178.1\|2592455_2592737_+	helix-turn-helix domain-containing protein	NA	NA	NA	NA
WP_041864905.1\|2592723_2593110_+	hypothetical protein	NA	NA	NA	NA
WP_015459180.1\|2593102_2595502_+	bifunctional DNA primase/polymerase	NA	NA	NA	NA
WP_015459181.1\|2595876_2596359_+	hypothetical protein	NA	NA	NA	NA
WP_015459182.1\|2596377_2597733_+	Terminase-like family protein	A0A0S0N2B2	Pseudomonas_phage	2.2e-32	27.8
WP_051128732.1\|2597748_2598576_+	hypothetical protein	NA	NA	NA	NA
WP_015459184.1\|2598572_2598773_+	hypothetical protein	NA	NA	NA	NA
WP_015459185.1\|2599043_2599286_+	hypothetical protein	NA	NA	NA	NA
WP_144061970.1\|2599424_2600185_-\|transposase	IS5 family transposase	A0A1V0SLQ8	Klosneuvirus	1.2e-08	25.1
WP_015459186.1\|2600451_2600679_+	hypothetical protein	NA	NA	NA	NA
2600640:2600657	attL	NA	NA	NA	NA
WP_144062041.1\|2601255_2602305_+	Reverse transcriptase	NA	NA	NA	NA
WP_015459188.1\|2602557_2603832_+\|integrase	site-specific integrase	K7PGY1	Enterobacteria_phage	2.4e-09	20.4
WP_172595472.1\|2603819_2603975_-	hypothetical protein	NA	NA	NA	NA
WP_144062042.1\|2604041_2604611_-	transglycosylase SLT domain-containing protein	A0A0H3V0Q1	Geobacillus_virus	1.3e-23	48.5
WP_015459191.1\|2605629_2606358_-	ATP-binding protein	A0A059NT77	Lactococcus_phage	3.4e-32	38.0
2605969:2605986	attR	NA	NA	NA	NA
WP_015460387.1\|2606344_2607859_-\|transposase	IS21 family transposase	NA	NA	NA	NA

DBSCAN-SWA_5

3093961 : 3134667

Ralstonia_phage(12.5%)

integrase

attL 3084562:3084577|attR 3140470:3140485

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
3084562:3084577	attL	NA	NA	NA	NA
WP_015459632.1\|3093961_3095158_+\|integrase	site-specific integrase	A0A077KET4	Ralstonia_phage	4.3e-64	38.4
WP_015459633.1\|3095186_3095861_-	lytic transglycosylase domain-containing protein	A0A0H3V0Q1	Geobacillus_virus	3.7e-25	42.8
WP_144062158.1\|3096074_3096881_+	toprim domain-containing protein	A0A0H5AWB1	Pseudomonas_phage	6.7e-13	32.5
WP_015459635.1\|3096953_3099167_+	strawberry notch family protein	NA	NA	NA	NA
WP_009823939.1\|3099211_3100216_-\|integrase	site-specific integrase	NA	NA	NA	NA
WP_009823940.1\|3100212_3101568_-\|integrase	tyrosine-type recombinase/integrase	NA	NA	NA	NA
WP_015449381.1\|3101564_3102797_-\|integrase	tyrosine-type recombinase/integrase	A0A1P8DJ76	Virus_Rctr85	3.5e-05	26.8
WP_144062159.1\|3103170_3105021_+	strawberry notch C-terminal domain-containing protein	A0A076FMQ0	Aureococcus_anophage	6.2e-14	31.2
WP_144062160.1\|3105090_3105573_-	hypothetical protein	NA	NA	NA	NA
WP_144062062.1\|3105588_3106287_-	hypothetical protein	NA	NA	NA	NA
WP_051128846.1\|3106387_3106813_-	SOS response-associated peptidase family protein	NA	NA	NA	NA
WP_015459640.1\|3106968_3107589_+	SOS response-associated peptidase	NA	NA	NA	NA
WP_015459641.1\|3107591_3110921_-	error-prone DNA polymerase	Q8W6C3	Saccharomonospora_phage	3.9e-83	26.6
WP_015459642.1\|3110917_3112459_-	DNA polymerase Y family protein	NA	NA	NA	NA
WP_015459643.1\|3112379_3113111_-	hypothetical protein	NA	NA	NA	NA
WP_015459644.1\|3113235_3114159_-	copper homeostasis membrane protein CopD	NA	NA	NA	NA
WP_041864946.1\|3114162_3114531_-	copper homeostasis periplasmic binding protein CopC	NA	NA	NA	NA
WP_015459646.1\|3114685_3115480_-	DUF305 domain-containing protein	NA	NA	NA	NA
WP_041865451.1\|3115579_3116113_-	DUF411 domain-containing protein	NA	NA	NA	NA
WP_015459648.1\|3116135_3116624_-	DUF305 domain-containing protein	NA	NA	NA	NA
WP_015459649.1\|3116658_3117834_-	copper resistance protein B	NA	NA	NA	NA
WP_015459650.1\|3117830_3119912_-	copper resistance system multicopper oxidase	NA	NA	NA	NA
WP_144062063.1\|3119987_3120275_-	hypothetical protein	NA	NA	NA	NA
WP_015459652.1\|3120271_3120625_-	hypothetical protein	NA	NA	NA	NA
WP_015459653.1\|3120736_3121138_+	MerR family DNA-binding protein	NA	NA	NA	NA
WP_015459654.1\|3121203_3123576_-	heavy metal translocating P-type ATPase	A0A218MNH6	uncultured_virus	5.1e-69	31.8
WP_015459655.1\|3123851_3124205_+	helix-turn-helix transcriptional regulator	NA	NA	NA	NA
WP_015459656.1\|3124201_3124672_+	VOC family protein	NA	NA	NA	NA
WP_015459657.1\|3124668_3125076_+	arsenate reductase (glutaredoxin)	A0A2H4J8T1	uncultured_Caudovirales_phage	4.5e-42	64.3
WP_015459658.1\|3125068_3126142_+	ACR3 family arsenite efflux transporter	NA	NA	NA	NA
WP_015459659.1\|3126258_3128259_+	ParB/RepB/Spo0J family partition protein	NA	NA	NA	NA
WP_015459660.1\|3128413_3129163_+	DUF1738 domain-containing protein	NA	NA	NA	NA
WP_015449377.1\|3129320_3130670_+\|integrase	tyrosine-type recombinase/integrase	NA	NA	NA	NA
WP_037465845.1\|3130666_3132457_+	hypothetical protein	NA	NA	NA	NA
WP_015449375.1\|3132453_3134667_+\|integrase	phage integrase	NA	NA	NA	NA
3140470:3140485	attR	NA	NA	NA	NA

DBSCAN-SWA_6

3621454 : 3628698

Geobacillus_phage(25.0%)

head,portal,capsid,tail,protease

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_015460095.1\|3621454_3622576_+\|portal	phage portal protein	W8ECU7	Geobacillus_phage	1.1e-48	39.2
WP_015460096.1\|3622575_3622884_+	hypothetical protein	K4I011	Acidithiobacillus_phage	1.6e-07	47.4
WP_015460097.1\|3622889_3623348_+\|head,protease	HK97 family phage prohead protease	I6S2W2	Marinomonas_phage	3.0e-18	41.6
WP_041865533.1\|3623362_3624508_+\|capsid	phage major capsid protein	A0A192Y5T6	Salmonella_phage	1.0e-78	50.8
WP_015460099.1\|3624588_3624855_+	hypothetical protein	NA	NA	NA	NA
WP_170112669.1\|3624869_3625016_+	hypothetical protein	NA	NA	NA	NA
WP_015460100.1\|3625019_3626471_+	hypothetical protein	NA	NA	NA	NA
WP_041865534.1\|3626482_3626761_+	hypothetical protein	NA	NA	NA	NA
WP_015460102.1\|3626760_3627297_+\|head,tail	phage head-tail connector protein	NA	NA	NA	NA
WP_015460103.1\|3627293_3627626_+\|head,tail	head-tail adaptor protein	NA	NA	NA	NA
WP_015460104.1\|3627622_3627841_+	hypothetical protein	NA	NA	NA	NA
WP_015460105.1\|3627837_3628218_+	DUF3168 domain-containing protein	NA	NA	NA	NA
WP_015460106.1\|3628290_3628698_+\|tail	phage major tail protein, TP901-1 family	NA	NA	NA	NA

Anti-CRISPR protein detection

Acr ID	Acr position	Acr size	Homology with known anti	Neighbor HTH/AcRanker	Neighbor Aca	In prophage	Protospacer in prophage

2. NC_020563

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Crispr_ID: NC_020563_1

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_020563_1

33078-33167

Orphan

Consensus_repeat	Method
AAAAGTGAGTTTTGGGGTCGAGTC	CRISPRCasFinder

1 spacers

The CRISPR arrays of NC_020563_1

>merge|NC_020563|1|33078-33167|CRISPRCasFinder
AAAAGTGAGTTTTGGGGTCGAGTCGCGTGAGTGTTGGGGTAGCCTTCGGTGAGTTTTGGGGTCGGTAAAAGTGAGTTTTGGGGTCGAGTC

>NC_020563|1|1|33078-33167|CRISPRCasFinder
AAAAGTGAGTTTTGGGGTCGAGTC	GCGTGAGTGTTGGGGTAGCCTTCGGTGAGTTTTGGGGTCGGT
AAAAGTGAGTTTTGGGGTCGAGTC

Protein	Signature genes	Signature genes Name	Protein_function
NC_020563.2\|WP_015460630.1\|26733_27456_-\|hypothetical-protein	unknown	unknown	unknown
NC_020563.2\|WP_007683476.1\|24224_25586_+\|hypothetical-protein	unknown	unknown	unknown
NC_020563.2\|WP_007683471.1\|20557_23488_-\|Tn3-family-transposase	unknown	unknown	gnl\|CDD\|376561
NC_020563.2\|WP_001389365.1\|18032_18797_+\|IS6-like-element-IS6100-family-transposase	unknown	unknown	gnl\|CDD\|225853
NC_020563.2\|WP_015460623.1\|27463_30598_-\|Ti-type-conjugative-transfer-relaxase-TraA	unknown	unknown	gnl\|CDD\|237546
NC_020563.2\|WP_007682112.1\|19932_20187_-\|hypothetical-protein	unknown	unknown	unknown
NC_020563.2\|WP_007683474.1\|23634_24228_+\|recombinase-family-protein	unknown	unknown	gnl\|CDD\|239737
NC_020563.2\|WP_015460622.1\|30770_31076_+\|conjugal-transfer-protein-TraD	unknown	unknown	gnl\|CDD\|368890
NC_020563.2\|WP_015460628.1\|18956_19847_-\|haloalkane-dehalogenase	unknown	unknown	gnl\|CDD\|235135
NC_020563.2\|WP_015460621.1\|31113_31338_+\|conjugal-transfer-protein-TraD	unknown	unknown	gnl\|CDD\|368890

Protein	Function_ID	Function_description	E-value
NC_020563.2\|WP_007683474.1\|23634_24228_+\|recombinase-family-protein	gnl\|CDD\|239737	cd03768, SR_ResInv, Serine Recombinase (SR) family, Resolvase and Invertase subfamily, catalytic domain; members contain a C-terminal DNA binding domain. Serine recombinases catalyze site-specific recombination of DNA molecules by a concerted, four-strand cleavage and rejoining mechanism which involves a transient phosphoserine linkage between DNA and the enzyme. They are functionally versatile and include resolvases, invertases, integrases, and transposases. Resolvases and invertases affect resolution or inversion and comprise a major phylogenic group. Resolvases (e.g. Tn3, gamma-delta, and Tn5044) normally recombine two sites in direct repeat causing deletion of the DNA between the sites. Invertases (e.g. Gin and Hin) recombine sites in inverted repeat to invert the DNA between the sites. Cointegrate resolution with gamma-delta resolvase requires the formation of a synaptosome of three resolvase dimers bound to each of two res sites on the DNA. Also included in this subfamily are some putative integrases including a sequence from bacteriophage phi-FC1.	8.30623e-53
NC_020563.2\|WP_007683471.1\|20557_23488_-\|Tn3-family-transposase	gnl\|CDD\|376561	pfam01526, DDE_Tnp_Tn3, Tn3 transposase DDE domain. This family includes transposases of Tn3, Tn21, Tn1721, Tn2501, Tn3926 transposons from E-coli. The specific binding of the Tn3 transposase to DNA has been demonstrated. Sequence analysis has suggested that the invariant triad of Asp689, Asp765, Glu895 (numbering as in Tn3) may correspond to the D-D-35-E motif previously implicated in the catalysis of numerous transposases.	3.70754e-154
NC_020563.2\|WP_001389365.1\|18032_18797_+\|IS6-like-element-IS6100-family-transposase	gnl\|CDD\|225853	COG3316, COG3316, Transposase and inactivated derivatives [DNA replication, recombination, and repair].	8.97603e-67
NC_020563.2\|WP_015460623.1\|27463_30598_-\|Ti-type-conjugative-transfer-relaxase-TraA	gnl\|CDD\|237546	PRK13889, PRK13889, conjugal transfer relaxase TraA; Provisional.	0
NC_020563.2\|WP_015460622.1\|30770_31076_+\|conjugal-transfer-protein-TraD	gnl\|CDD\|368890	pfam06412, TraD, Conjugal transfer protein TraD. This family contains bacterial TraD conjugal transfer proteins. Mutations in the TraD gene result in loss of transfer.	8.00175e-11
NC_020563.2\|WP_015460628.1\|18956_19847_-\|haloalkane-dehalogenase	gnl\|CDD\|235135	PRK03592, PRK03592, haloalkane dehalogenase; Provisional.	1.89434e-170
NC_020563.2\|WP_015460621.1\|31113_31338_+\|conjugal-transfer-protein-TraD	gnl\|CDD\|368890	pfam06412, TraD, Conjugal transfer protein TraD. This family contains bacterial TraD conjugal transfer proteins. Mutations in the TraD gene result in loss of transfer.	6.89947e-14

>NC_020563.2|WP_015460621.1|31113_31338_+|conjugal-transfer-protein-TraD
MARRERTRHLIELGGLVQKAGLVELADDDRATLYGALLDCTARVQGDDAGNVLALWKRRGKRAFDAEAEGAGNG
>NC_020563.2|WP_015460622.1|30770_31076_+|conjugal-transfer-protein-TraD
MRKVRDYDAELRALNDKAKALKARKVQQLGELVTSTGADALDLDTLAGALLAAVEAADANEKEAWRSRGAAFFQGRGRKAGRRTGGNGEGARQTGAGKEQA
>NC_020563.2|WP_015460623.1|27463_30598_-|Ti-type-conjugative-transfer-relaxase-TraA
MAIYHFSAKVISRANGSSAVASAAYRAAERLHDDRLGRDHDFSNKAGVVHSEILAPEGAPERLNDRATLWNEVEAGEKRKDAQLAREVEFSIPRELNQQQGIQLARDFVEKQFVERGMVADMNVHWDMGKDGQPKPHAHVMLSMREVGPEGFGQKVREWNSTALLQEWRVAWADHVNERLAELDIDARIDHRTLEAQGIDLEPQHKIGPAASRMPEQGLEAERVEDHARIARENGEKIIARPEIALDAIARQQATFTRRDLAQFAFRHSDGKDQFDQVMSAVRSSPELVALGRDGKGEDRFTSRDMIAAEQRLERAAEGLAIDRGHGVADAHVTRALASAEGRGLDLSAEQRGALAHITGDKGLASVVGYAGSGKSAMLGVAREAWEAQGYQVRGAALSGIAAENLEGGSAIASRTIASMEYQWEQGRELLGPRDVLVIDEAGMIGTRQMECVLSHAEQAGAKVVLVGDPEQLQAIEAGAAFRAVTERHGWAEITEIRRQCEDWQRDATKALATGRAGEAIHAYEAHGMVQAAETRELARADLVDRWDAERIAAPDQSRIILTHTNAEVRDLNLAARDRLRDAGELGPDVRVSAERGARDFATGDRIMFLKNERGLGVRNGTLGKVEQVSPERMAVKLDDGRSVAFDLKDYAHVDHGYAATIHKSQGVTVDRAHVLATPGMDRHSAYVALSRHRDGVQLHYGRDDFGDDRRLVRTLSRERAKDMASDYGRDRDAEIRAFADRRGLSGEIRLPERAERSPVEILGPRAGTMRQMGEDPRTVRDAGDRGAGAGQAAAERQPRRGMFDGFRPAPQRPAPESTPAGEREKAAPKRGMFDGLKLSAAPLKGAERAPVPADRGQGRDYARAVERASRSAEAVLQARASGAPVLEHQKVALERTTQALDQIRPGASRDLASAMQRDPALLREAAAGRSGPMIEAMAQEARVRADPNLRADRFVERWQGLKQERDRLYRAGDMAGRERTGKEMAGMAKSLERDPQVELVLRNRTRELGLEIGMGRGRGMNSGDLGRELARDLGIGMGRGMSR
>NC_020563.2|WP_015460630.1|26733_27456_-|hypothetical-protein
MMDEDNYRNNGRAGDDPQAAFEQLRGEVALVRLAVEGLARARESIEIPDYQPTLANTEKILLALTQRVDVIAKSPAMKLTPETMGERVNASVASATGELHNLVNSTRSDMSEAARELRGLIGTTRARWQQDRWLFWIGLGGVVLGILLYALLAGLIARAMPDSWQLPERMATRALAEPTLWDAGTHLMQRASPASWEGIVAAANLARDNRETIEACGAAAAKAKKTVRCTIEVKPANNDR
>NC_020563.2|WP_007683476.1|24224_25586_+|hypothetical-protein
MKRGHDLTGLMKFATRPEWADDLHDALDDHLGPVLTQFDIDSDELPGIIGDHWAMTLWGCAFEDLVTRVFEPDGRNIVDEYLKRRGWNEAGPNKLYMRALKTSVMSVYEVSAIEPGVGFLARDLIRGGDPVQVRERTASRTLGPWDRIGVRIIPVSGHRILAGGLLSFTAEATSALLEALRLGQGKRGPRAKLVIDDDQLRDLAPLISMVWLFDILPRMLEPVAIPTLHNADGEEVVFHRVRFPFTRGTTQALIGDRLDTVPALQRETSHFWNWLGTRTKQGKKGTGQMAWGVSMEDGTPVLGNLELKGRALILSVTSAERAERGVALVTQALGALVGTPLTEIETIEQAMAARQEGRTVSEPAPDIPVEVATPLVHGMLDRQYRTLLDEPVPMLGDKTPRQCAGSKAGRDQLATWLKHLENLSGRHADIDDPMATYDFGWIWQELGIEELRR
>NC_020563.2|WP_007683474.1|23634_24228_+|recombinase-family-protein
MTRAPYLIGYARVSKGDEQSNAAQRRALDAAGCRRVFEEIASGGRWDRPKLLEMIGQLRDSDVVVVWKLDRLSRSLKDLLHIMERIEAAGAGFRSLTEAIDTTTAAGRMMMQMVGSFAEFERAMIRERTSAGLAQARAEGRIGGRRRKLGEKQRREIAESVISGRKSGAEMARLYHVSEPTVSRIVAAHRQTMELPA
>NC_020563.2|WP_007683471.1|20557_23488_-|Tn3-family-transposase
MTTRQRAALLMLPDDEAAIVKHYSLSGEDMTAIDTARTPATRLGYALQLCCLRYPGRHLRHGELLPAVMLDHIAEQVGVDAKVIADFARRTPTRYDQLAAIKTRFGFSDLSRPHRVELRTWLTNEAASIIDGRALLGRLLDEMRARRIVIPGVSVVERMAAEAIHQAETDLVAAIDGGLGHEMRQQLDALIDDKVHDRQSRLSWLREPEPRVASASLLEIVEKITLIRGTGISAFSPDVRHEPRLGQFAREGVRYTAQAFQQMRPARRRVVLLATLRELEATLTDAAIDMFIALVGRAHLRARKRLEQRVAVSGREGRERMLRIARVLEAISQAARAGGDVAAAVDAVASLDIIDADAAIIRRTASPHRNEVLDEIAAEYRAFKRMGPSFVRAFDFQGRAGMQPLRDAMAILADLDGDWRRALPDDVPLGHVEHRWRRHVMTAGGIDRTHWEMATYSALSNALASGGIWVPTARVHRALSVLLAPPASPVPKPAFSLGDPHAWLDERAARLDSALREVARDLDKRDPPLFAGERLRFPKDPKEDPGQDEGRQLALTCYGMVPATRITDVLSQVQRWTGFIQHFGHVSTGLPPADERAFLATLIAEATNLGLSRMAEVCGVASRRALLRMQTWHMREETFRAALASLTDAIHAEPLAAWFGSGHRASADGQAYYLGGAGEAGGTVNAHYGRDPVVKIYTTITDRYAPLHQTVIAGTAGEAIHALDGILGHESSADITALHTDGGGVSDIVFAVMHLLGLDFEPRIPRLSDRQLYGFEPARRYGRLAPLFGRRLGRDLIVSHWAEIAEVIAAMRDRTVTPSLILKKLSAYRQQNSLAAALREVGRIERTLFTLRWFDDTDLRRTVTAELNKGEARNSLARAVAFHRLGRFRDRGLENQQTRAAALNLVTAAIILFNCRYLGRAVDELRHRGTPVDPAMLSRLSPLGWDRINLTGDYIWSESLDLDADGLMPLLIKPLP
>NC_020563.2|WP_007682112.1|19932_20187_-|hypothetical-protein
MLKLHDFCNRAGARILWCTPVFGQAVGTQHIDEILAVWYPTHKTFLDLSDAPGAKESYRLRGACVAYAVIHRCSGSNSPLDGNG
>NC_020563.2|WP_015460628.1|18956_19847_-|haloalkane-dehalogenase
MSLGAKPFGEKKFIEIKGRRMAYIDEGTGDPILFQHGNPTSSYLWRNIMPHCAGLGRLIACDLIGMGDSDKLDPSGPERYAYAEHRDYLDALWEALDLGDRVVLVVHDWGSVLGFDWARRHRERVQGIAYMEAVTMPLEWADFPEQDRDLFQAFRSQAGEELVLQDNVFVEQVLPGLILRPLSEAEMAAYREPFLAAGEARRPTLSWPRQIPIAGTPADVVAIVRDYAGWLSESPIPKLFINAEPGSLTTGRIRDFCRTWPNQTEITVAGAHFIQEDSPDEIGAAIAAFVRRLRPA
>NC_020563.2|WP_001389365.1|18032_18797_+|IS6-like-element-IS6100-family-transposase
MTDFKWRHFQGDVILWAVRWYCRYPISYRDLEEMLAERGISVDHTTIYRWVQCYAPEMEKRLRWFWRRGFDPSWRLDETYVKVRGKWTYLYRAVDKRGDTIDFYLSPTRSAKAAKRFLGKALRGLKHWEKPATLNTDKAPSYGAAITELKREGKLDRETAHRQVKYLNNVIEADHGKLKILIKPVRGFKSIPTAYATIKGFEVMRALRKGQARPWCLQPGIRGEVRLVERAFGIGPSALTEAMGMLNHHFAAAA

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Mismatch	Identity

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity
NC_020563_1	1.1\|33102\|42\|NC_020563\|CRISPRCasFinder	33102-33143	42	NZ_CP005192	Sphingobium sp. MI1205 plasmid pMI3, complete sequence	31147-31188	0	1.0
NC_020563_1	1.1\|33102\|42\|NC_020563\|CRISPRCasFinder	33102-33143	42	NZ_CP005087	Sphingobium sp. TKS plasmid pTK3, complete sequence	20315-20356	0	1.0
NC_020563_1	1.1\|33102\|42\|NC_020563\|CRISPRCasFinder	33102-33143	42	NC_020562	Sphingomonas sp. MM-1 plasmid pISP1, complete sequence	159529-159570	0	1.0
NC_020563_1	1.1\|33102\|42\|NC_020563\|CRISPRCasFinder	33102-33143	42	NZ_CP005193	Sphingobium sp. MI1205 plasmid pMI4, complete sequence	18238-18279	0	1.0
NC_020563_1	1.1\|33102\|42\|NC_020563\|CRISPRCasFinder	33102-33143	42	NC_020563	Sphingomonas sp. MM-1 plasmid pISP4, complete sequence	33102-33143	0	1.0
NC_020563_1	1.1\|33102\|42\|NC_020563\|CRISPRCasFinder	33102-33143	42	NZ_CP005088	Sphingobium sp. TKS plasmid pTK4, complete sequence	56281-56322	0	1.0
NC_020563_1	1.1\|33102\|42\|NC_020563\|CRISPRCasFinder	33102-33143	42	NZ_AP017658	Sphingobium cloacae strain JCM 10874 plasmid pSCLO_4, complete sequence	34773-34814	1	0.976
NC_020563_1	1.1\|33102\|42\|NC_020563\|CRISPRCasFinder	33102-33143	42	NZ_CP047220	Sphingobium yanoikuyae strain YC-JY1 plasmid unnamed3, complete sequence	56938-56979	2	0.952

1. spacer 1.1|33102|42|NC_020563|CRISPRCasFinder matches to NZ_CP005192 (Sphingobium sp. MI1205 plasmid pMI3, complete sequence) position: , mismatch: 0, identity: 1.0

gcgtgagtgttggggtagccttcggtgagttttggggtcggt	CRISPR spacer
gcgtgagtgttggggtagccttcggtgagttttggggtcggt	Protospacer
******************************************

2. spacer 1.1|33102|42|NC_020563|CRISPRCasFinder matches to NZ_CP005087 (Sphingobium sp. TKS plasmid pTK3, complete sequence) position: , mismatch: 0, identity: 1.0

gcgtgagtgttggggtagccttcggtgagttttggggtcggt	CRISPR spacer
gcgtgagtgttggggtagccttcggtgagttttggggtcggt	Protospacer
******************************************

3. spacer 1.1|33102|42|NC_020563|CRISPRCasFinder matches to NC_020562 (Sphingomonas sp. MM-1 plasmid pISP1, complete sequence) position: , mismatch: 0, identity: 1.0

gcgtgagtgttggggtagccttcggtgagttttggggtcggt	CRISPR spacer
gcgtgagtgttggggtagccttcggtgagttttggggtcggt	Protospacer
******************************************

4. spacer 1.1|33102|42|NC_020563|CRISPRCasFinder matches to NZ_CP005193 (Sphingobium sp. MI1205 plasmid pMI4, complete sequence) position: , mismatch: 0, identity: 1.0

gcgtgagtgttggggtagccttcggtgagttttggggtcggt	CRISPR spacer
gcgtgagtgttggggtagccttcggtgagttttggggtcggt	Protospacer
******************************************

5. spacer 1.1|33102|42|NC_020563|CRISPRCasFinder matches to NC_020563 (Sphingomonas sp. MM-1 plasmid pISP4, complete sequence) position: , mismatch: 0, identity: 1.0

gcgtgagtgttggggtagccttcggtgagttttggggtcggt	CRISPR spacer
gcgtgagtgttggggtagccttcggtgagttttggggtcggt	Protospacer
******************************************

6. spacer 1.1|33102|42|NC_020563|CRISPRCasFinder matches to NZ_CP005088 (Sphingobium sp. TKS plasmid pTK4, complete sequence) position: , mismatch: 0, identity: 1.0

gcgtgagtgttggggtagccttcggtgagttttggggtcggt	CRISPR spacer
gcgtgagtgttggggtagccttcggtgagttttggggtcggt	Protospacer
******************************************

7. spacer 1.1|33102|42|NC_020563|CRISPRCasFinder matches to NZ_AP017658 (Sphingobium cloacae strain JCM 10874 plasmid pSCLO_4, complete sequence) position: , mismatch: 1, identity: 0.976

gcgtgagtgttggggtagccttcggtgagttttggggtcggt	CRISPR spacer
gcgtgagttttggggtagccttcggtgagttttggggtcggt	Protospacer
******** *********************************

8. spacer 1.1|33102|42|NC_020563|CRISPRCasFinder matches to NZ_CP047220 (Sphingobium yanoikuyae strain YC-JY1 plasmid unnamed3, complete sequence) position: , mismatch: 2, identity: 0.952

gcgtgagtgttggggtagccttcggtgagttttggggtcggt	CRISPR spacer
gcgtgagttttagggtagccttcggtgagttttggggtcggt	Protospacer
******** **.******************************

Prophage detection

Region

Region Position

Protein_number

Hit_taxonomy

Key_proteins

Att_site

Prophage annotation

DBSCAN-SWA_1

12403 : 23488

Escherichia_phage(28.57%)

transposase

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_001389365.1\|12403_13168_-\|transposase	IS6-like element IS6100 family transposase	A0A077SL39	Escherichia_phage	4.3e-86	65.7
WP_007682039.1\|13742_14504_+	SDR family oxidoreductase	A0A0M4JSW6	Mollivirus	8.8e-15	28.2
WP_081440685.1\|14549_15218_+	EthD domain-containing protein	NA	NA	NA	NA
WP_145907151.1\|15162_15456_-	hypothetical protein	NA	NA	NA	NA
WP_007682041.1\|15638_16313_+\|transposase	IS5 family transposase	A0A0M5M147	Mycobacterium_phage	4.3e-05	31.9
WP_007682049.1\|16774_17107_-	BrnA antitoxin family protein	NA	NA	NA	NA
WP_007682056.1\|17087_17396_-	BrnT family toxin	NA	NA	NA	NA
WP_029987071.1\|17427_17988_-	recombinase family protein	A0A0C4UR34	Shigella_phage	3.0e-36	51.2
WP_001389365.1\|18032_18797_+\|transposase	IS6-like element IS6100 family transposase	A0A077SL39	Escherichia_phage	4.3e-86	65.7
WP_015460628.1\|18956_19847_-	haloalkane dehalogenase	B9U1C3	Vaccinia_virus	2.9e-57	43.4
WP_007682112.1\|19932_20187_-	hypothetical protein	NA	NA	NA	NA
WP_007683471.1\|20557_23488_-\|transposase	Tn3 family transposase	A0A1B0V7H9	Salmonella_phage	1.7e-151	35.1

Anti-CRISPR protein detection

Acr ID	Acr position	Acr size	Homology with known anti	Neighbor HTH/AcRanker	Neighbor Aca	In prophage	Protospacer in prophage

3. NC_020542

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Mismatch	Identity

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity

Prophage detection

Region

Region Position

Protein_number

Hit_taxonomy

Key_proteins

Att_site

Prophage annotation

DBSCAN-SWA_1

0 : 6641

Pseudomonas_phage(33.33%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_015449216.1\|2233_3100_-	toprim domain-containing protein	A0A0H5AWB1	Pseudomonas_phage	1.8e-08	32.3
WP_015449217.1\|3162_3489_-	single-stranded DNA-binding protein	K7ZMK1	Xanthomonas_citri_phage	1.4e-06	31.1
WP_041865596.1\|4155_5244_+	replication initiation protein	NA	NA	NA	NA
WP_015449219.1\|5438_6641_+	AAA family ATPase	A0A1I9KF58	Aeromonas_phage	6.6e-41	31.7

DBSCAN-SWA_2

12205 : 18440

Burkholderia_phage(20.0%)

integrase,transposase

attL 6711:6726|attR 27718:27733

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
6711:6726	attL	NA	NA	NA	NA
WP_009824028.1\|12205_13084_-	AAA family ATPase	B5TA81	Burkholderia_phage	1.0e-06	25.4
WP_015449225.1\|13010_14411_-\|integrase,transposase	DDE-type integrase/transposase/recombinase	L7P850	Pseudomonas_phage	2.1e-17	29.3
WP_015449226.1\|14602_15175_+	recombinase family protein	A0A0A7NPV4	Enterobacteria_phage	6.2e-37	47.6
WP_015449228.1\|16207_17725_+\|transposase	IS21 family transposase	A0A2L1IVA1	Escherichia_phage	4.8e-12	26.2
WP_015449229.1\|17711_18440_+	ATP-binding protein	A0A059NT77	Lactococcus_phage	5.6e-35	39.3
27718:27733	attR	NA	NA	NA	NA

DBSCAN-SWA_3

31125 : 40571

Salmonella_phage(50.0%)

transposase

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_004212886.1\|31125_33627_+	heavy metal translocating P-type ATPase	E4ZFI9	Streptococcus_phage	7.7e-124	41.0
WP_004213255.1\|34086_34647_-	recombinase family protein	A0A1B0V7I5	Salmonella_phage	4.6e-45	79.3
WP_014072603.1\|34817_35240_-	helix-turn-helix domain-containing protein	NA	NA	NA	NA
WP_014072602.1\|35316_35712_+	mercury transporter MerT	NA	NA	NA	NA
WP_004213249.1\|35724_36054_+	heavy-metal-associated domain-containing protein	NA	NA	NA	NA
WP_004213247.1\|36091_37510_+	mercury(II) reductase	A0A2K5B2C5	Erysipelothrix_phage	2.4e-42	28.7
WP_015449233.1\|37601_40571_+\|transposase	Tn3 family transposase	A0A1B0V7H9	Salmonella_phage	7.0e-209	39.9

DBSCAN-SWA_4

43987 : 54331

Ochrobactrum_phage(20.0%)

transposase

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_015449237.1\|43987_44542_-	AAA family ATPase	A0A219VHB7	Ochrobactrum_phage	2.4e-22	58.4
WP_015449238.1\|44534_44753_-	conjugal transfer protein TraD	NA	NA	NA	NA
WP_015449239.1\|44790_45096_-	conjugal transfer protein TraD	NA	NA	NA	NA
WP_015449240.1\|45269_48428_+	Ti-type conjugative transfer relaxase TraA	V5UQN3	Mycobacterium_phage	9.0e-13	26.9
WP_015449241.1\|48440_49157_+	hypothetical protein	NA	NA	NA	NA
WP_144062182.1\|49232_49613_+	hypothetical protein	NA	NA	NA	NA
WP_084673707.1\|49639_50422_-	Fic family protein	NA	NA	NA	NA
WP_144062183.1\|50423_51104_-	ATP-binding cassette domain-containing protein	W8CYL7	Bacillus_phage	2.1e-31	42.6
WP_015449243.1\|51194_52283_+\|transposase	IS5 family transposase	E5E3P6	Burkholderia_phage	4.1e-13	26.1
WP_144062184.1\|52371_53148_-	ABC transporter ATP-binding protein	NA	NA	NA	NA
WP_015449414.1\|53283_53529_-	hypothetical protein	NA	NA	NA	NA
WP_013039114.1\|53737_54331_-	recombinase family protein	A0A1S6L009	Salmonella_phage	2.2e-45	56.6

DBSCAN-SWA_5

60030 : 62388

uncultured_virus(100.0%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_015449247.1\|60030_62388_-	heavy metal translocating P-type ATPase	A0A218MNH6	uncultured_virus	6.8e-74	33.9

DBSCAN-SWA_6

68812 : 70880

Klosneuvirus(50.0%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_015449253.1\|68812_69286_+	DUF305 domain-containing protein	A0A1V0SJW0	Klosneuvirus	1.4e-05	34.3
WP_015449254.1\|69344_70880_+	PAS domain S-box protein	A0A1V0S925	Catovirus	7.0e-11	34.7

DBSCAN-SWA_7

75163 : 77866

Acinetobacter_phage(100.0%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_015449259.1\|75163_77866_+	TonB-dependent receptor	A0A0P0I887	Acinetobacter_phage	1.8e-33	24.4

DBSCAN-SWA_8

84652 : 85678

Tupanvirus(100.0%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_004212676.1\|84652_85678_-	alcohol dehydrogenase AdhP	A0A2K9L339	Tupanvirus	1.3e-32	28.9

DBSCAN-SWA_9

93081 : 94992

Synechococcus_phage(100.0%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_015449268.1\|93081_94992_-	2Fe-2S iron-sulfur cluster binding domain-containing protein	I3ULH6	Synechococcus_phage	2.6e-07	45.7

DBSCAN-SWA_10

98454 : 102890

Salmonella_phage(50.0%)

transposase

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_003100881.1\|98454_101421_-\|transposase	Tn3-like element ISPa38 family transposase	A0A1B0V7H9	Salmonella_phage	0.0e+00	73.2
WP_001247892.1\|101579_101870_+	nucleotidyltransferase	NA	NA	NA	NA
WP_041865600.1\|102125_102890_+\|transposase	IS6-like element IS6100 family transposase	A0A077SL39	Escherichia_phage	2.1e-85	65.2

DBSCAN-SWA_11

108000 : 108594

Salmonella_phage(100.0%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_013039114.1\|108000_108594_+	recombinase family protein	A0A1S6L009	Salmonella_phage	2.2e-45	56.6

DBSCAN-SWA_12

116832 : 117813

Pandoravirus(100.0%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_007687842.1\|116832_117813_-	MBL fold metallo-hydrolase	S4VYV9	Pandoravirus	1.1e-12	28.0

DBSCAN-SWA_13

123113 : 125490

Synechococcus_phage(50.0%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_007687828.1\|123113_124214_+	NAD(P)-dependent alcohol dehydrogenase	E3SJ82	Synechococcus_phage	2.7e-25	29.7
WP_007687826.1\|124257_125490_+	cytochrome P450	A0A2I2L575	Orpheovirus	4.2e-06	24.2

DBSCAN-SWA_14

136929 : 142602

Acanthamoeba_polyphaga_mimivirus(25.0%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_015449279.1\|136929_137919_-	alpha/beta hydrolase	A0A2L2DMU8	Acanthamoeba_polyphaga_mimivirus	1.4e-20	28.1
WP_015449280.1\|137915_138653_-	SDR family oxidoreductase	W8CYX9	Bacillus_phage	4.5e-08	35.5
WP_015449281.1\|138649_140629_-	NAD(P)/FAD-dependent oxidoreductase	NA	NA	NA	NA
WP_015449282.1\|140693_141803_-	alcohol dehydrogenase catalytic domain-containing protein	A0A0K0KVL7	Prochlorococcus_phage	3.2e-29	29.7
WP_015449283.1\|141852_142602_-	SDR family oxidoreductase	Q06VL0	Trichoplusia_ni_ascovirus	1.6e-13	27.8

DBSCAN-SWA_15

156747 : 160427

Salmonella_phage(50.0%)

transposase

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_015449292.1\|156747_159717_-\|transposase	Tn3 family transposase	A0A1B0V7H9	Salmonella_phage	4.3e-198	39.7
WP_011607925.1\|159857_160427_+	recombinase family protein	A0A219Y9V9	Aeromonas_phage	1.2e-32	45.0

DBSCAN-SWA_16

171179 : 182075

Enterobacteria_phage(25.0%)

transposase

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_015449303.1\|171179_174185_-\|transposase	Tn3 family transposase	Q1MVP5	Enterobacteria_phage	4.5e-256	46.9
WP_015449304.1\|174194_174812_-	recombinase family protein	A0A286S1P7	Klebsiella_phage	1.5e-44	52.7
WP_144062188.1\|176553_177916_+\|transposase	IS3 family transposase	Q6J1X2	Lactobacillus_phage	1.3e-08	28.1
WP_015449309.1\|178203_179988_-	chloride channel protein	NA	NA	NA	NA
WP_015449310.1\|180082_180478_+	MarR family transcriptional regulator	NA	NA	NA	NA
WP_015449312.1\|180902_182075_+	cystathionine gamma-synthase	A0A0B5JD48	Pandoravirus	3.8e-25	33.4

DBSCAN-SWA_17

187487 : 189720

Escherichia_phage(50.0%)

transposase

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_015449228.1\|187487_189005_+\|transposase	IS21 family transposase	A0A2L1IVA1	Escherichia_phage	4.8e-12	26.2
WP_015449229.1\|188991_189720_+	ATP-binding protein	A0A059NT77	Lactococcus_phage	5.6e-35	39.3

DBSCAN-SWA_18

198629 : 202626

uncultured_virus(50.0%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_015449327.1\|198629_200891_+	cadmium-translocating P-type ATPase	A0A218MNH6	uncultured_virus	8.0e-72	29.6
WP_004212718.1\|200887_201097_+	cbb3-type cytochrome oxidase assembly protein CcoS	NA	NA	NA	NA
WP_015449328.1\|201453_202626_+	cystathionine gamma-synthase	A0A0B5JD48	Pandoravirus	2.1e-23	33.2

DBSCAN-SWA_19

223805 : 227105

Beihai_Nido-like_virus(100.0%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_015449351.1\|223805_227105_+	TM0106 family RecB-like putative nuclease	A0A1L3KIW1	Beihai_Nido-like_virus	1.3e-06	27.0

DBSCAN-SWA_20

231013 : 238926

uncultured_Mediterranean_phage(100.0%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_015449354.1\|231013_236128_+	DEAD/DEAH box helicase	A0A1B1IUF6	uncultured_Mediterranean_phage	6.1e-51	22.1
WP_015449355.1\|236124_238926_+	DEAD/DEAH box helicase	A0A1B1IUI1	uncultured_Mediterranean_phage	8.0e-29	25.9

DBSCAN-SWA_21

243832 : 245540

Salmonella_phage(50.0%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_015449358.1\|243832_245095_-	Y-family DNA polymerase	I6RSM4	Salmonella_phage	1.2e-72	38.5
WP_015449359.1\|245102_245540_-	translesion error-prone DNA polymerase V autoproteolytic subunit	A0A1W6JNS2	Morganella_phage	5.6e-14	42.2

DBSCAN-SWA_22

250032 : 251121

Burkholderia_phage(100.0%)

transposase

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_015449243.1\|250032_251121_-\|transposase	IS5 family transposase	E5E3P6	Burkholderia_phage	4.1e-13	26.1

DBSCAN-SWA_23

255007 : 258870

Leptospira_phage(33.33%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_015449366.1\|255007_255940_-	ParB/RepB/Spo0J family partition protein	S5VTK0	Leptospira_phage	2.9e-12	33.5
WP_021245272.1\|256324_256717_-	DUF3768 domain-containing protein	L7TKV8	Rhizobium_phage	2.9e-14	42.2
WP_015449370.1\|257685_258870_-	Na+/H+ antiporter NhaA	A0A2H4J5W3	uncultured_Caudovirales_phage	6.2e-100	57.3

DBSCAN-SWA_24

261877 : 262780

Caulobacter_phage(100.0%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_015449374.1\|261877_262780_-	DUF1738 domain-containing protein	A0A1V0EEV1	Caulobacter_phage	1.9e-40	36.8

DBSCAN-SWA_25

268333 : 269080

Caulobacter_phage(100.0%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_015449378.1\|268333_269080_-	DUF1738 domain-containing protein	A0A1V0EBY3	Caulobacter_phage	3.3e-38	42.0

DBSCAN-SWA_26

272135 : 275721

Thermus_phage(50.0%)

integrase

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_009823939.1\|272135_273140_-\|integrase	site-specific integrase	S6C485	Thermus_phage	6.2e-08	26.9
WP_009823940.1\|273136_274492_-\|integrase	tyrosine-type recombinase/integrase	NA	NA	NA	NA
WP_015449381.1\|274488_275721_-\|integrase	tyrosine-type recombinase/integrase	A0A0K2CP59	Brevibacillus_phage	1.6e-05	22.2

Anti-CRISPR protein detection

Acr ID	Acr position	Acr size	Homology with known anti	Neighbor HTH/AcRanker	Neighbor Aca	In prophage	Protospacer in prophage

4. NC_020562

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Crispr_ID: NC_020562_1

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NC_020562_1

159505-159594

Orphan

Consensus_repeat	Method
GACTCGACCCCAAAACTCACTTTT	CRISPRCasFinder

1 spacers

The CRISPR arrays of NC_020562_1

>merge|NC_020562|1|159505-159594|CRISPRCasFinder
GACTCGACCCCAAAACTCACTTTTACCGACCCCAAAACTCACCGAAGGCTACCCCAACACTCACGCGACTCGACCCCAAAACTCACTTTT

>NC_020562|1|1|159505-159594|CRISPRCasFinder
GACTCGACCCCAAAACTCACTTTT	ACCGACCCCAAAACTCACCGAAGGCTACCCCAACACTCACGC
GACTCGACCCCAAAACTCACTTTT

Protein	Signature genes	Signature genes Name	Protein_function
NC_020562.1\|WP_015460616.1\|157477_158113_+\|AAA-family-ATPase	unknown	unknown	gnl\|CDD\|222854
NC_020562.1\|WP_007683476.1\|167085_168447_-\|hypothetical-protein	unknown	unknown	unknown
NC_020562.1\|WP_007685994.1\|155815_156508_+\|hypothetical-protein	unknown	unknown	unknown
NC_020562.1\|WP_007683471.1\|169183_172114_+\|Tn3-family-transposase	unknown	unknown	gnl\|CDD\|376561
NC_020562.1\|WP_015460617.1\|158138_158420_+\|hypothetical-protein	unknown	unknown	unknown
NC_020562.1\|WP_001389365.1\|149286_150051_-\|IS6-like-element-IS6100-family-transposase	unknown	unknown	gnl\|CDD\|225853
NC_020562.1\|WP_007683474.1\|168443_169037_-\|recombinase-family-protein	unknown	unknown	gnl\|CDD\|239737
NC_020562.1\|WP_015460630.1\|165215_165938_+\|hypothetical-protein	unknown	unknown	unknown
NC_020562.1\|WP_001389365.1\|152685_153450_-\|IS6-like-element-IS6100-family-transposase	unknown	unknown	gnl\|CDD\|225853
NC_020562.1\|WP_015460618.1\|158476_159388_-\|replication-initiation-protein	unknown	unknown	gnl\|CDD\|376444
NC_020562.1\|WP_007682394.1\|148140_148827_+\|EthD-domain-containing-protein	unknown	unknown	gnl\|CDD\|369213
NC_020562.1\|WP_007682395.1\|148826_149189_+\|hypothetical-protein	unknown	unknown	unknown
NC_020562.1\|WP_007685993.1\|155053_155650_-\|recombinase-family-protein	unknown	unknown	gnl\|CDD\|239737
NC_020562.1\|WP_007687861.1\|150753_151512_-\|esterase	unknown	unknown	gnl\|CDD\|223477
NC_020562.1\|WP_015460622.1\|161595_161901_-\|conjugal-transfer-protein-TraD	unknown	unknown	gnl\|CDD\|368890
NC_020562.1\|WP_015460623.1\|162073_165208_+\|Ti-type-conjugative-transfer-relaxase-TraA	unknown	unknown	gnl\|CDD\|237546
NC_020562.1\|WP_015460621.1\|161333_161558_-\|conjugal-transfer-protein-TraD	unknown	unknown	gnl\|CDD\|368890

Protein	Function_ID	Function_description	E-value
NC_020562.1\|WP_015460616.1\|157477_158113_+\|AAA-family-ATPase	gnl\|CDD\|222854	PHA02518, PHA02518, ParA-like protein; Provisional.	3.43275e-46
NC_020562.1\|WP_001389365.1\|149286_150051_-\|IS6-like-element-IS6100-family-transposase	gnl\|CDD\|225853	COG3316, COG3316, Transposase and inactivated derivatives [DNA replication, recombination, and repair].	8.97603e-67
NC_020562.1\|WP_007683471.1\|169183_172114_+\|Tn3-family-transposase	gnl\|CDD\|376561	pfam01526, DDE_Tnp_Tn3, Tn3 transposase DDE domain. This family includes transposases of Tn3, Tn21, Tn1721, Tn2501, Tn3926 transposons from E-coli. The specific binding of the Tn3 transposase to DNA has been demonstrated. Sequence analysis has suggested that the invariant triad of Asp689, Asp765, Glu895 (numbering as in Tn3) may correspond to the D-D-35-E motif previously implicated in the catalysis of numerous transposases.	3.70754e-154
NC_020562.1\|WP_007683474.1\|168443_169037_-\|recombinase-family-protein	gnl\|CDD\|239737	cd03768, SR_ResInv, Serine Recombinase (SR) family, Resolvase and Invertase subfamily, catalytic domain; members contain a C-terminal DNA binding domain. Serine recombinases catalyze site-specific recombination of DNA molecules by a concerted, four-strand cleavage and rejoining mechanism which involves a transient phosphoserine linkage between DNA and the enzyme. They are functionally versatile and include resolvases, invertases, integrases, and transposases. Resolvases and invertases affect resolution or inversion and comprise a major phylogenic group. Resolvases (e.g. Tn3, gamma-delta, and Tn5044) normally recombine two sites in direct repeat causing deletion of the DNA between the sites. Invertases (e.g. Gin and Hin) recombine sites in inverted repeat to invert the DNA between the sites. Cointegrate resolution with gamma-delta resolvase requires the formation of a synaptosome of three resolvase dimers bound to each of two res sites on the DNA. Also included in this subfamily are some putative integrases including a sequence from bacteriophage phi-FC1.	8.30623e-53
NC_020562.1\|WP_001389365.1\|152685_153450_-\|IS6-like-element-IS6100-family-transposase	gnl\|CDD\|225853	COG3316, COG3316, Transposase and inactivated derivatives [DNA replication, recombination, and repair].	8.97603e-67
NC_020562.1\|WP_015460618.1\|158476_159388_-\|replication-initiation-protein	gnl\|CDD\|376444	pfam01051, Rep_3, Initiator Replication protein. This protein is an initiator of plasmid replication. RepB possesses nicking-closing (topoisomerase I) like activity. It is also able to perform a strand transfer reaction on ssDNA that contains its target. This family also includes RepA which is an E.coli protein involved in plasmid replication. The RepA protein binds to DNA repeats that flank the repA gene.	1.07935e-25
NC_020562.1\|WP_007682394.1\|148140_148827_+\|EthD-domain-containing-protein	gnl\|CDD\|369213	pfam07110, EthD, EthD domain. This family consists of several bacterial sequences which are related to the EthD protein of Rhodococcus ruber. In Rhodococcus ruber, EthD is thought to be involved in the degradation of ethyl tert-butyl ether (ETBE). EthD synthesis is induced by ETBE but it's exact function is unknown, it is however thought to be essential to the ETBE degradation system.	2.54157e-12
NC_020562.1\|WP_007685993.1\|155053_155650_-\|recombinase-family-protein	gnl\|CDD\|239737	cd03768, SR_ResInv, Serine Recombinase (SR) family, Resolvase and Invertase subfamily, catalytic domain; members contain a C-terminal DNA binding domain. Serine recombinases catalyze site-specific recombination of DNA molecules by a concerted, four-strand cleavage and rejoining mechanism which involves a transient phosphoserine linkage between DNA and the enzyme. They are functionally versatile and include resolvases, invertases, integrases, and transposases. Resolvases and invertases affect resolution or inversion and comprise a major phylogenic group. Resolvases (e.g. Tn3, gamma-delta, and Tn5044) normally recombine two sites in direct repeat causing deletion of the DNA between the sites. Invertases (e.g. Gin and Hin) recombine sites in inverted repeat to invert the DNA between the sites. Cointegrate resolution with gamma-delta resolvase requires the formation of a synaptosome of three resolvase dimers bound to each of two res sites on the DNA. Also included in this subfamily are some putative integrases including a sequence from bacteriophage phi-FC1.	1.5936e-58
NC_020562.1\|WP_007687861.1\|150753_151512_-\|esterase	gnl\|CDD\|223477	COG0400, COG0400, Predicted esterase [General function prediction only].	5.069e-25
NC_020562.1\|WP_015460622.1\|161595_161901_-\|conjugal-transfer-protein-TraD	gnl\|CDD\|368890	pfam06412, TraD, Conjugal transfer protein TraD. This family contains bacterial TraD conjugal transfer proteins. Mutations in the TraD gene result in loss of transfer.	8.00175e-11
NC_020562.1\|WP_015460623.1\|162073_165208_+\|Ti-type-conjugative-transfer-relaxase-TraA	gnl\|CDD\|237546	PRK13889, PRK13889, conjugal transfer relaxase TraA; Provisional.	0
NC_020562.1\|WP_015460621.1\|161333_161558_-\|conjugal-transfer-protein-TraD	gnl\|CDD\|368890	pfam06412, TraD, Conjugal transfer protein TraD. This family contains bacterial TraD conjugal transfer proteins. Mutations in the TraD gene result in loss of transfer.	6.89947e-14

>NC_020562.1|WP_015460618.1|158476_159388_-|replication-initiation-protein
MTRASSPVNNGKAKIALGDDTALTLSQKGRGNPFDPANYGEIVKPGELVDIVELSPLTLADRRIYNLLIANAWERISEPVIHRIAKTALKGTHQGNERIESSLLRLMGTIAIVTIRKGGKSYKRRVQLLGSSDESLEKDGFLHYRIPEELIEILRNSEVYARLKTQVMYCFESKYALCLYEMIERRIGLEYKQSEEFTIAELRGLLNVPEGKLERFADFNKYCLKVAQEEINKLCPFWVEFTPIKKGRKVERVSMMWLPKTMSGRRDAQNLIDQHSIVRRAKLRGDIPEMPVLVDFSAPAAQR
>NC_020562.1|WP_015460617.1|158138_158420_+|hypothetical-protein
MAIARKPNSKPKSPMDEAAADAFIAGAAKPKAEPIATEADEAGQGAEPRKSPVMLRFDRALLAKVDAAAKRRGISRSAWIQFTVSRALDAGEG
>NC_020562.1|WP_015460616.1|157477_158113_+|AAA-family-ATPase
MILAVGNTKGGVGKTTLAVNLAVARALAGRDLLLVDGDEQGTALTFTELRADRLGQAGYTAVALTGAALRSQVRQLAAKYDDIIIDVGGRDTGSLRAALTVADTLLVPVQPRSFDVWALDQVAALVAEAREINEGLRAVAVLNGADAQGADNEAALEMIGDIEGIEVLPTSIVRRKAFPNAAAEGRAVGEQSPRDAKAIDELAALVSAVFV
>NC_020562.1|WP_007685994.1|155815_156508_+|hypothetical-protein
MQVLDTVGWVGDGDDTDFFLAIERTFDLRLRSNLPWTTFGEVRDHVVAHVAAYSGGGTTCATQMTFYRLRRALGLGRHVGPDAPLAPLIGGKLRQAFSDLEADTDLKMPATRAGWLGIVSGLCFAVAVAILAFTTLAPPLRIFAAGASAYAGLWLRHLDRRRLPRRCDTIGDLARLVTEQNRGRLARDGARLTAPEIWRIIQQLAAEESGIDPDLIGSETTFFRAKVRAA
>NC_020562.1|WP_007685993.1|155053_155650_-|recombinase-family-protein
MRVGYARVSTSDQNPELQLDALRRAGCERVFTEKASGARDDRPELARILEDVLRAGDTLVVWKLDRLARSLKKLIATAEDLEREKIGLVSLTESIDTTTPGGMLTFHVFGAIAQFERALIRERTTAGLVEARRQGRKGGRPSAMRPSDVAAARAMMKEGTLPVRDIAKRMGVSVATLYRYAGKRGSGASIKEAATAHG
>NC_020562.1|WP_001389365.1|152685_153450_-|IS6-like-element-IS6100-family-transposase
MTDFKWRHFQGDVILWAVRWYCRYPISYRDLEEMLAERGISVDHTTIYRWVQCYAPEMEKRLRWFWRRGFDPSWRLDETYVKVRGKWTYLYRAVDKRGDTIDFYLSPTRSAKAAKRFLGKALRGLKHWEKPATLNTDKAPSYGAAITELKREGKLDRETAHRQVKYLNNVIEADHGKLKILIKPVRGFKSIPTAYATIKGFEVMRALRKGQARPWCLQPGIRGEVRLVERAFGIGPSALTEAMGMLNHHFAAAA
>NC_020562.1|WP_007687861.1|150753_151512_-|esterase
MVALSISRQAEYPPTGKPAKTGSRSSRADAVGPDAASASHRQELEANMSRDNAIVMRYDNPDIPSGRDIVYLHGRGSTEREAGFALPLFGRANVRSYRGPLPQGPGFAWFENAGIGVALPSSLSGETSKVGDWIAADTGRQRPWLCGFSNGAAMAASLLLSNPGAYSGLIMIGGCFAVEDGDLPDNGLLDKPVLFCRGQFDDVIPRHKFEQAEAYLSGPSGARATFIPYEGGHELPLPIKAAVQGWLGAESR
>NC_020562.1|WP_001389365.1|149286_150051_-|IS6-like-element-IS6100-family-transposase
MTDFKWRHFQGDVILWAVRWYCRYPISYRDLEEMLAERGISVDHTTIYRWVQCYAPEMEKRLRWFWRRGFDPSWRLDETYVKVRGKWTYLYRAVDKRGDTIDFYLSPTRSAKAAKRFLGKALRGLKHWEKPATLNTDKAPSYGAAITELKREGKLDRETAHRQVKYLNNVIEADHGKLKILIKPVRGFKSIPTAYATIKGFEVMRALRKGQARPWCLQPGIRGEVRLVERAFGIGPSALTEAMGMLNHHFAAAA
>NC_020562.1|WP_007682395.1|148826_149189_+|hypothetical-protein
MPAPALDEEPVLPPGFEDLLEFVPHWIGETAQERWDIRARATMAEITRFYDVLLSRSEAILDHVETFPLDAMPAPTLRLFRLQLALAHAAMSVELHKQPRAHNSPYPHQVRILRTAEPTL
>NC_020562.1|WP_007682394.1|148140_148827_+|EthD-domain-containing-protein
MHSIKILATIPRRKDISEQQFHDHWRHPHGTLSKKIACLRGYVQSHRIVSPLLPDTQLAYDGITELWYDSLDDALNMGKDPAHRKYNIPDEPLFVDMDGLKFTFFEEDIIRSRPAVDDPDDAAVQWSPTEWSVSVKILQLVKADGNPAWAGDQDKALGDRIGAFRHVRSFAIDAVHKGTSPFIGARELWWPTLSDFERGVAGDRAAFDALLAQAGQHYTMLASAERVI
>NC_020562.1|WP_015460621.1|161333_161558_-|conjugal-transfer-protein-TraD
MARRERTRHLIELGGLVQKAGLVELADDDRATLYGALLDCTARVQGDDAGNVLALWKRRGKRAFDAEAEGAGNG
>NC_020562.1|WP_015460622.1|161595_161901_-|conjugal-transfer-protein-TraD
MRKVRDYDAELRALNDKAKALKARKVQQLGELVTSTGADALDLDTLAGALLAAVEAADANEKEAWRSRGAAFFQGRGRKAGRRTGGNGEGARQTGAGKEQA
>NC_020562.1|WP_015460623.1|162073_165208_+|Ti-type-conjugative-transfer-relaxase-TraA
MAIYHFSAKVISRANGSSAVASAAYRAAERLHDDRLGRDHDFSNKAGVVHSEILAPEGAPERLNDRATLWNEVEAGEKRKDAQLAREVEFSIPRELNQQQGIQLARDFVEKQFVERGMVADMNVHWDMGKDGQPKPHAHVMLSMREVGPEGFGQKVREWNSTALLQEWRVAWADHVNERLAELDIDARIDHRTLEAQGIDLEPQHKIGPAASRMPEQGLEAERVEDHARIARENGEKIIARPEIALDAIARQQATFTRRDLAQFAFRHSDGKDQFDQVMSAVRSSPELVALGRDGKGEDRFTSRDMIAAEQRLERAAEGLAIDRGHGVADAHVTRALASAEGRGLDLSAEQRGALAHITGDKGLASVVGYAGSGKSAMLGVAREAWEAQGYQVRGAALSGIAAENLEGGSAIASRTIASMEYQWEQGRELLGPRDVLVIDEAGMIGTRQMECVLSHAEQAGAKVVLVGDPEQLQAIEAGAAFRAVTERHGWAEITEIRRQCEDWQRDATKALATGRAGEAIHAYEAHGMVQAAETRELARADLVDRWDAERIAAPDQSRIILTHTNAEVRDLNLAARDRLRDAGELGPDVRVSAERGARDFATGDRIMFLKNERGLGVRNGTLGKVEQVSPERMAVKLDDGRSVAFDLKDYAHVDHGYAATIHKSQGVTVDRAHVLATPGMDRHSAYVALSRHRDGVQLHYGRDDFGDDRRLVRTLSRERAKDMASDYGRDRDAEIRAFADRRGLSGEIRLPERAERSPVEILGPRAGTMRQMGEDPRTVRDAGDRGAGAGQAAAERQPRRGMFDGFRPAPQRPAPESTPAGEREKAAPKRGMFDGLKLSAAPLKGAERAPVPADRGQGRDYARAVERASRSAEAVLQARASGAPVLEHQKVALERTTQALDQIRPGASRDLASAMQRDPALLREAAAGRSGPMIEAMAQEARVRADPNLRADRFVERWQGLKQERDRLYRAGDMAGRERTGKEMAGMAKSLERDPQVELVLRNRTRELGLEIGMGRGRGMNSGDLGRELARDLGIGMGRGMSR
>NC_020562.1|WP_015460630.1|165215_165938_+|hypothetical-protein
MMDEDNYRNNGRAGDDPQAAFEQLRGEVALVRLAVEGLARARESIEIPDYQPTLANTEKILLALTQRVDVIAKSPAMKLTPETMGERVNASVASATGELHNLVNSTRSDMSEAARELRGLIGTTRARWQQDRWLFWIGLGGVVLGILLYALLAGLIARAMPDSWQLPERMATRALAEPTLWDAGTHLMQRASPASWEGIVAAANLARDNRETIEACGAAAAKAKKTVRCTIEVKPANNDR
>NC_020562.1|WP_007683476.1|167085_168447_-|hypothetical-protein
MKRGHDLTGLMKFATRPEWADDLHDALDDHLGPVLTQFDIDSDELPGIIGDHWAMTLWGCAFEDLVTRVFEPDGRNIVDEYLKRRGWNEAGPNKLYMRALKTSVMSVYEVSAIEPGVGFLARDLIRGGDPVQVRERTASRTLGPWDRIGVRIIPVSGHRILAGGLLSFTAEATSALLEALRLGQGKRGPRAKLVIDDDQLRDLAPLISMVWLFDILPRMLEPVAIPTLHNADGEEVVFHRVRFPFTRGTTQALIGDRLDTVPALQRETSHFWNWLGTRTKQGKKGTGQMAWGVSMEDGTPVLGNLELKGRALILSVTSAERAERGVALVTQALGALVGTPLTEIETIEQAMAARQEGRTVSEPAPDIPVEVATPLVHGMLDRQYRTLLDEPVPMLGDKTPRQCAGSKAGRDQLATWLKHLENLSGRHADIDDPMATYDFGWIWQELGIEELRR
>NC_020562.1|WP_007683474.1|168443_169037_-|recombinase-family-protein
MTRAPYLIGYARVSKGDEQSNAAQRRALDAAGCRRVFEEIASGGRWDRPKLLEMIGQLRDSDVVVVWKLDRLSRSLKDLLHIMERIEAAGAGFRSLTEAIDTTTAAGRMMMQMVGSFAEFERAMIRERTSAGLAQARAEGRIGGRRRKLGEKQRREIAESVISGRKSGAEMARLYHVSEPTVSRIVAAHRQTMELPA
>NC_020562.1|WP_007683471.1|169183_172114_+|Tn3-family-transposase
MTTRQRAALLMLPDDEAAIVKHYSLSGEDMTAIDTARTPATRLGYALQLCCLRYPGRHLRHGELLPAVMLDHIAEQVGVDAKVIADFARRTPTRYDQLAAIKTRFGFSDLSRPHRVELRTWLTNEAASIIDGRALLGRLLDEMRARRIVIPGVSVVERMAAEAIHQAETDLVAAIDGGLGHEMRQQLDALIDDKVHDRQSRLSWLREPEPRVASASLLEIVEKITLIRGTGISAFSPDVRHEPRLGQFAREGVRYTAQAFQQMRPARRRVVLLATLRELEATLTDAAIDMFIALVGRAHLRARKRLEQRVAVSGREGRERMLRIARVLEAISQAARAGGDVAAAVDAVASLDIIDADAAIIRRTASPHRNEVLDEIAAEYRAFKRMGPSFVRAFDFQGRAGMQPLRDAMAILADLDGDWRRALPDDVPLGHVEHRWRRHVMTAGGIDRTHWEMATYSALSNALASGGIWVPTARVHRALSVLLAPPASPVPKPAFSLGDPHAWLDERAARLDSALREVARDLDKRDPPLFAGERLRFPKDPKEDPGQDEGRQLALTCYGMVPATRITDVLSQVQRWTGFIQHFGHVSTGLPPADERAFLATLIAEATNLGLSRMAEVCGVASRRALLRMQTWHMREETFRAALASLTDAIHAEPLAAWFGSGHRASADGQAYYLGGAGEAGGTVNAHYGRDPVVKIYTTITDRYAPLHQTVIAGTAGEAIHALDGILGHESSADITALHTDGGGVSDIVFAVMHLLGLDFEPRIPRLSDRQLYGFEPARRYGRLAPLFGRRLGRDLIVSHWAEIAEVIAAMRDRTVTPSLILKKLSAYRQQNSLAAALREVGRIERTLFTLRWFDDTDLRRTVTAELNKGEARNSLARAVAFHRLGRFRDRGLENQQTRAAALNLVTAAIILFNCRYLGRAVDELRHRGTPVDPAMLSRLSPLGWDRINLTGDYIWSESLDLDADGLMPLLIKPLP

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Mismatch	Identity

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity
NC_020562_1	1.1\|159529\|42\|NC_020562\|CRISPRCasFinder	159529-159570	42	NZ_CP005192	Sphingobium sp. MI1205 plasmid pMI3, complete sequence	31147-31188	0	1.0
NC_020562_1	1.1\|159529\|42\|NC_020562\|CRISPRCasFinder	159529-159570	42	NZ_CP005087	Sphingobium sp. TKS plasmid pTK3, complete sequence	20315-20356	0	1.0
NC_020562_1	1.1\|159529\|42\|NC_020562\|CRISPRCasFinder	159529-159570	42	NC_020562	Sphingomonas sp. MM-1 plasmid pISP1, complete sequence	159529-159570	0	1.0
NC_020562_1	1.1\|159529\|42\|NC_020562\|CRISPRCasFinder	159529-159570	42	NZ_CP005193	Sphingobium sp. MI1205 plasmid pMI4, complete sequence	18238-18279	0	1.0
NC_020562_1	1.1\|159529\|42\|NC_020562\|CRISPRCasFinder	159529-159570	42	NC_020563	Sphingomonas sp. MM-1 plasmid pISP4, complete sequence	33102-33143	0	1.0
NC_020562_1	1.1\|159529\|42\|NC_020562\|CRISPRCasFinder	159529-159570	42	NZ_CP005088	Sphingobium sp. TKS plasmid pTK4, complete sequence	56281-56322	0	1.0
NC_020562_1	1.1\|159529\|42\|NC_020562\|CRISPRCasFinder	159529-159570	42	NZ_AP017658	Sphingobium cloacae strain JCM 10874 plasmid pSCLO_4, complete sequence	34773-34814	1	0.976
NC_020562_1	1.1\|159529\|42\|NC_020562\|CRISPRCasFinder	159529-159570	42	NZ_CP047220	Sphingobium yanoikuyae strain YC-JY1 plasmid unnamed3, complete sequence	56938-56979	2	0.952

1. spacer 1.1|159529|42|NC_020562|CRISPRCasFinder matches to NZ_CP005192 (Sphingobium sp. MI1205 plasmid pMI3, complete sequence) position: , mismatch: 0, identity: 1.0

accgaccccaaaactcaccgaaggctaccccaacactcacgc	CRISPR spacer
accgaccccaaaactcaccgaaggctaccccaacactcacgc	Protospacer
******************************************

2. spacer 1.1|159529|42|NC_020562|CRISPRCasFinder matches to NZ_CP005087 (Sphingobium sp. TKS plasmid pTK3, complete sequence) position: , mismatch: 0, identity: 1.0

accgaccccaaaactcaccgaaggctaccccaacactcacgc	CRISPR spacer
accgaccccaaaactcaccgaaggctaccccaacactcacgc	Protospacer
******************************************

3. spacer 1.1|159529|42|NC_020562|CRISPRCasFinder matches to NC_020562 (Sphingomonas sp. MM-1 plasmid pISP1, complete sequence) position: , mismatch: 0, identity: 1.0

accgaccccaaaactcaccgaaggctaccccaacactcacgc	CRISPR spacer
accgaccccaaaactcaccgaaggctaccccaacactcacgc	Protospacer
******************************************

4. spacer 1.1|159529|42|NC_020562|CRISPRCasFinder matches to NZ_CP005193 (Sphingobium sp. MI1205 plasmid pMI4, complete sequence) position: , mismatch: 0, identity: 1.0

accgaccccaaaactcaccgaaggctaccccaacactcacgc	CRISPR spacer
accgaccccaaaactcaccgaaggctaccccaacactcacgc	Protospacer
******************************************

5. spacer 1.1|159529|42|NC_020562|CRISPRCasFinder matches to NC_020563 (Sphingomonas sp. MM-1 plasmid pISP4, complete sequence) position: , mismatch: 0, identity: 1.0

accgaccccaaaactcaccgaaggctaccccaacactcacgc	CRISPR spacer
accgaccccaaaactcaccgaaggctaccccaacactcacgc	Protospacer
******************************************

6. spacer 1.1|159529|42|NC_020562|CRISPRCasFinder matches to NZ_CP005088 (Sphingobium sp. TKS plasmid pTK4, complete sequence) position: , mismatch: 0, identity: 1.0

accgaccccaaaactcaccgaaggctaccccaacactcacgc	CRISPR spacer
accgaccccaaaactcaccgaaggctaccccaacactcacgc	Protospacer
******************************************

7. spacer 1.1|159529|42|NC_020562|CRISPRCasFinder matches to NZ_AP017658 (Sphingobium cloacae strain JCM 10874 plasmid pSCLO_4, complete sequence) position: , mismatch: 1, identity: 0.976

accgaccccaaaactcaccgaaggctaccccaacactcacgc	CRISPR spacer
accgaccccaaaactcaccgaaggctaccccaaaactcacgc	Protospacer
********************************* ********

8. spacer 1.1|159529|42|NC_020562|CRISPRCasFinder matches to NZ_CP047220 (Sphingobium yanoikuyae strain YC-JY1 plasmid unnamed3, complete sequence) position: , mismatch: 2, identity: 0.952

accgaccccaaaactcaccgaaggctaccccaacactcacgc	CRISPR spacer
accgaccccaaaactcaccgaaggctaccctaaaactcacgc	Protospacer
******************************.** ********

Prophage detection

Region	Region Position	Protein_number	Hit_taxonomy	Key_proteins	Att_site	Prophage annotation

Anti-CRISPR protein detection

Acr ID	Acr position	Acr size	Homology with known anti	Neighbor HTH/AcRanker	Neighbor Aca	In prophage	Protospacer in prophage

Overview of predicted results

Overview of the results

Cas Category Instructions

Results visualization

1. NC_020561

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection

2. NC_020563

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Click the colored protein region to show detailed information

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection

3. NC_020542

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection

4. NC_020562

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Click the colored protein region to show detailed information

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection