CRISPRimmunity

Please click to download your results

Overview of predicted results

Overview of the results

Contig_ID	Contig_def	CRISPR array number	Contig Signature genes	Self targeting spacer number	Target MGE spacer number	Prophage number	Anti-CRISPR protein number
NZ_CP029123	Escherichia coli strain AR434 plasmid unnamed1, complete sequence	0 crisprs	DEDDh	0	0	1	0
NZ_CP029122	Escherichia coli strain AR434 chromosome, complete genome	11 crisprs	RT,csa3,PD-DExK,cas5,cas6e,cas1,cas2,cas3,DEDDh,c2c9_V-U4,DinG	0	24	9	0

Results visualization

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Mismatch	Identity

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity

Prophage detection

Region

Region Position

Protein_number

Hit_taxonomy

Key_proteins

Att_site

Prophage annotation

DBSCAN-SWA_1

2205 : 49895

Escherichia_phage(33.33%)

transposase,integrase

attL 19131:19146|attR 47124:47139

The bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_009364894.1\|2205_2910_-\|transposase	IS6-like element IS26 family transposase	A0A077SL39	Escherichia_phage	4.0e-139	99.6
WP_011977797.1\|2900_3749_+	RepB family plasmid replication initiator protein	A0A218MNI2	uncultured_virus	3.3e-47	43.3
WP_011977798.1\|4389_4911_-	hypothetical protein	NA	NA	NA	NA
WP_108711103.1\|4968_5745_-	dihydrofolate reductase	A0A1C9LW38	Vibrio_phage	4.0e-15	40.6
WP_001067855.1\|5913_6618_-\|transposase	IS6-like element IS26 family transposase	A0A077SL39	Escherichia_phage	1.8e-139	100.0
WP_050576375.1\|6608_9641_+\|transposase	Tn3 family transposase	Q1MVP5	Enterobacteria_phage	0.0e+00	99.2
WP_000429836.1\|9835_10270_+	Hg(II)-responsive transcriptional regulator	NA	NA	NA	NA
WP_000427623.1\|10348_11353_+\|transposase	IS110-like element IS4321 family transposase	NA	NA	NA	NA
WP_000338626.1\|11758_11875_+	hypothetical protein	NA	NA	NA	NA
WP_000868820.1\|11995_12370_+	hypothetical protein	NA	NA	NA	NA
WP_000988731.1\|12483_13209_+	hypothetical protein	NA	NA	NA	NA
WP_032410269.1\|13183_13387_-	hypothetical protein	NA	NA	NA	NA
WP_001257735.1\|13341_17595_+	RHS repeat protein	A0A2H4JHK7	uncultured_Caudovirales_phage	1.1e-18	47.6
WP_001326394.1\|17566_18007_+	hypothetical protein	NA	NA	NA	NA
WP_009364894.1\|18378_19083_+\|transposase	IS6-like element IS26 family transposase	A0A077SL39	Escherichia_phage	4.0e-139	99.6
19131:19146	attL	NA	NA	NA	NA
WP_072199448.1\|19573_19993_+	AAA family ATPase	NA	NA	NA	NA
WP_014342213.1\|20325_20451_+	hypothetical protein	NA	NA	NA	NA
WP_014342212.1\|21962_22112_+	hypothetical protein	NA	NA	NA	NA
WP_000080860.1\|22078_23215_-	DUF3883 domain-containing protein	NA	NA	NA	NA
WP_000248278.1\|23265_23493_-	hypothetical protein	NA	NA	NA	NA
WP_000951934.1\|23516_23708_+	hypothetical protein	NA	NA	NA	NA
WP_000587837.1\|24189_24732_-	AAA family ATPase	NA	NA	NA	NA
WP_000557454.1\|24744_25605_-	aminoglycoside N-acetyltransferase AAC(3)-IId	NA	NA	NA	NA
WP_085940656.1\|25737_26882_-\|transposase	IS3-like element ISAba14 family transposase	S5WIU1	Leptospira_phage	2.3e-14	28.1
WP_108711104.1\|27686_29747_-\|integrase,transposase	DDE-type integrase/transposase/recombinase	NA	NA	NA	NA
WP_017781026.1\|29760_30588_-\|transposase	heteromeric transposase endonuclease subunit TnsA	NA	NA	NA	NA
WP_001324342.1\|32900_34424_+\|transposase	IS21-like element IS1326 family transposase	A0A2L1IVA1	Escherichia_phage	1.2e-15	24.2
WP_001163403.1\|34413_35196_+	ATP-binding protein	A0A2L1IVB6	Escherichia_phage	2.5e-33	35.0
WP_000376623.1\|35730_36231_-	GNAT family N-acetyltransferase	NA	NA	NA	NA
WP_000259031.1\|36358_37198_-	sulfonamide-resistant dihydropteroate synthase Sul1	A0A0B5J4J5	Pandoravirus	5.0e-11	27.2
WP_000679427.1\|37191_37539_-	quaternary ammonium compound efflux SMR transporter QacE delta 1	NA	NA	NA	NA
WP_063865160.1\|39038_39938_+	class A extended-spectrum beta-lactamase VEB-5	NA	NA	NA	NA
WP_088498802.1\|40671_41724_-	Tet(A)/Tet(B)/Tet(C) family tetracycline efflux MFS transporter	NA	NA	NA	NA
WP_000259031.1\|41887_42727_-	sulfonamide-resistant dihydropteroate synthase Sul1	A0A0B5J4J5	Pandoravirus	5.0e-11	27.2
WP_000679427.1\|42720_43068_-	quaternary ammonium compound efflux SMR transporter QacE delta 1	NA	NA	NA	NA
WP_032488579.1\|43236_43791_-	aminoglycoside N-acetyltransferase AAC(6')-Ib3	NA	NA	NA	NA
WP_002075255.1\|43960_44974_+\|integrase	class 1 integron integrase IntI1	A0A1P8DJJ6	Virus_Rctr41k	6.1e-72	45.5
WP_001162012.1\|45279_45837_+	recombinase family protein	A0A1B0V7I5	Salmonella_phage	5.8e-48	81.3
WP_001138073.1\|45839_48812_+\|transposase	Tn3 family transposase	A0A1B0V7H9	Salmonella_phage	0.0e+00	73.1
47124:47139	attR	NA	NA	NA	NA
WP_000427620.1\|48890_49895_+\|transposase	IS110-like element IS4321 family transposase	NA	NA	NA	NA

Anti-CRISPR protein detection

Acr ID	Acr position	Acr size	Homology with known anti	Neighbor HTH/AcRanker	Neighbor Aca	In prophage	Protospacer in prophage

2. NZ_CP029122

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Crispr_ID: NZ_CP029122_1

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP029122_1

892263-892402

Orphan

Consensus_repeat	Method
TTTGTATCGTTGTAGGCCTGATAAGACGCGGCAAGCGTCGCATCAGGCA	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_CP029122_1

>merge|NZ_CP029122|1|892263-892402|CRISPRCasFinder
TTTGTATCGTTGTAGGCCTGATAAGACGCGGCAAGCGTCGCATCAGGCAACAGCAGTCGGATGCGGCGTAAACACCTTATCTGACCTACGTTTTGTGTCGTTGTAGGCCTGATAAGACGCGGCAAGCGTCGCATCAGGCA

>NZ_CP029122|1|1|892263-892402|CRISPRCasFinder
TTTGTATCGTTGTAGGCCTGATAAGACGCGGCAAGCGTCGCATCAGGCA	ACAGCAGTCGGATGCGGCGTAAACACCTTATCTGACCTACGT
TTTGTGTCGTTGTAGGCCTGATAAGACGCGGCAAGCGTCGCATCAGGCA

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP029122.1\|WP_000246837.1\|893610_894006_-\|YraN-family-protein	unknown	unknown	gnl\|CDD\|129354
NZ_CP029122.1\|WP_001375265.1\|891170_892211_+\|permease	unknown	unknown	gnl\|CDD\|223773
NZ_CP029122.1\|WP_000534351.1\|903908_904700_-\|PTS-N-acetylgalactosamine-transporter-subunit-IID	unknown	unknown	gnl\|CDD\|182115
NZ_CP029122.1\|WP_001045434.1\|902167_902752_-\|type-1-fimbrial-protein	unknown	unknown	gnl\|CDD\|226069
NZ_CP029122.1\|WP_000130392.1\|884728_885736_-\|LLM-class-flavin-dependent-oxidoreductase	unknown	unknown	gnl\|CDD\|182505
NZ_CP029122.1\|WP_000449030.1\|889393_889837_+\|YhbP-family-protein	unknown	unknown	gnl\|CDD\|235127
NZ_CP029122.1\|WP_000816988.1\|896967_898059_-\|fimbrial-protein	unknown	unknown	gnl\|CDD\|366088
NZ_CP029122.1\|WP_000421305.1\|886828_887824_-\|U32-family-peptidase	unknown	unknown	gnl\|CDD\|223896
NZ_CP029122.1\|WP_001323952.1\|903152_903908_-\|galactosamine-6-phosphate-isomerase	unknown	unknown	gnl\|CDD\|182064
NZ_CP029122.1\|WP_000809262.1\|896064_896925_+\|16S-rRNA-(cytidine(1402)-2'-O)-methyltransferase	unknown	unknown	gnl\|CDD\|184956
NZ_CP029122.1\|WP_000249160.1\|893963_896000_-\|penicillin-binding-protein-activator-LpoA	unknown	unknown	gnl\|CDD\|225649
NZ_CP029122.1\|WP_001301318.1\|885941_886820_-\|U32-family-peptidase	unknown	unknown	gnl\|CDD\|237968
NZ_CP029122.1\|WP_001295551.1\|890462_891098_+\|NAD(P)H-binding-protein	unknown	unknown	gnl\|CDD\|187560
NZ_CP029122.1\|WP_000646033.1\|892415_892991_-\|divisome-associated-lipoprotein-YraP	unknown	unknown	gnl\|CDD\|182907
NZ_CP029122.1\|WP_000037608.1\|889816_890335_-\|protein/nucleic-acid-deglycase	unknown	unknown	gnl\|CDD\|153228
NZ_CP029122.1\|WP_001375267.1\|888032_888557_+\|SCP2-domain-containing-protein	unknown	unknown	gnl\|CDD\|225696
NZ_CP029122.1\|WP_000044770.1\|901392_902088_-\|molecular-chaperone	unknown	unknown	gnl\|CDD\|225663
NZ_CP029122.1\|WP_000908554.1\|888550_889054_+\|N-acetyltransferase	unknown	unknown	gnl\|CDD\|225695
NZ_CP029122.1\|WP_000189314.1\|889040_889343_-\|DNA-damage-response-exodeoxyribonuclease-YhbQ	unknown	unknown	gnl\|CDD\|178979
NZ_CP029122.1\|WP_001158034.1\|893000_893591_-\|DnaA-initiator-associating-protein-DiaA	unknown	unknown	gnl\|CDD\|182811

Protein	Function_ID	Function_description	E-value
NZ_CP029122.1\|WP_000246837.1\|893610_894006_-\|YraN-family-protein	gnl\|CDD\|129354	TIGR00252, UPF0102_protein_HI_1656, TIGR00252 family protein. the scores for Mycobacterium tuberculosis and Treponema pallidum are low considering the alignment [Hypothetical proteins, Conserved].	3.92681e-63
NZ_CP029122.1\|WP_001375265.1\|891170_892211_+\|permease	gnl\|CDD\|223773	COG0701, COG0701, Predicted permeases [General function prediction only].	4.11883e-63
NZ_CP029122.1\|WP_000534351.1\|903908_904700_-\|PTS-N-acetylgalactosamine-transporter-subunit-IID	gnl\|CDD\|182115	PRK09855, PRK09855, PTS N-acetylgalactosamine transporter subunit IID.	5.05026e-179
NZ_CP029122.1\|WP_001045434.1\|902167_902752_-\|type-1-fimbrial-protein	gnl\|CDD\|226069	COG3539, FimA, P pilus assembly protein, pilin FimA [Cell motility and secretion / Intracellular trafficking and secretion].	1.76746e-31
NZ_CP029122.1\|WP_000130392.1\|884728_885736_-\|LLM-class-flavin-dependent-oxidoreductase	gnl\|CDD\|182505	PRK10508, PRK10508, luciferase-like monooxygenase.	0
NZ_CP029122.1\|WP_000449030.1\|889393_889837_+\|YhbP-family-protein	gnl\|CDD\|235127	PRK03467, PRK03467, hypothetical protein; Provisional.	2.19601e-100
NZ_CP029122.1\|WP_000816988.1\|896967_898059_-\|fimbrial-protein	gnl\|CDD\|366088	pfam00419, Fimbrial, Fimbrial protein.	3.34626e-21
NZ_CP029122.1\|WP_000421305.1\|886828_887824_-\|U32-family-peptidase	gnl\|CDD\|223896	COG0826, COG0826, Collagenase and related proteases [Posttranslational modification, protein turnover, chaperones].	4.87234e-118
NZ_CP029122.1\|WP_001323952.1\|903152_903908_-\|galactosamine-6-phosphate-isomerase	gnl\|CDD\|182064	PRK09762, PRK09762, galactosamine-6-phosphate isomerase; Provisional.	1.51027e-147
NZ_CP029122.1\|WP_000809262.1\|896064_896925_+\|16S-rRNA-(cytidine(1402)-2'-O)-methyltransferase	gnl\|CDD\|184956	PRK14994, PRK14994, SAM-dependent 16S ribosomal RNA C1402 ribose 2'-O-methyltransferase; Provisional.	0
NZ_CP029122.1\|WP_000249160.1\|893963_896000_-\|penicillin-binding-protein-activator-LpoA	gnl\|CDD\|225649	COG3107, LppC, Putative lipoprotein [General function prediction only].	6.33924e-141
NZ_CP029122.1\|WP_001301318.1\|885941_886820_-\|U32-family-peptidase	gnl\|CDD\|237968	PRK15447, PRK15447, putative protease; Provisional.	0
NZ_CP029122.1\|WP_001295551.1\|890462_891098_+\|NAD(P)H-binding-protein	gnl\|CDD\|187560	cd05250, CC3_like_SDR_a, CC3(TIP30)-like, atypical (a) SDRs. Atypical SDRs in this subgroup include CC3 (also known as TIP30) which is implicated in tumor suppression. Atypical SDRs are distinct from classical SDRs. Members of this subgroup have a glycine rich NAD(P)-binding motif that resembles the extended SDRs, and have an active site triad of the SDRs (YXXXK and upstream Ser), although the upstream Asn of the usual SDR active site is substituted with Asp. For CC3, the Tyr of the triad is displaced compared to the usual SDRs and the protein is monomeric, both these observations suggest that the usual SDR catalytic activity is not present. NADP appears to serve an important role as a ligand, and may be important in the interaction with other macromolecules. Atypical SDRs generally lack the catalytic residues characteristic of the SDRs, and their glycine-rich NAD(P)-binding motif is often different from the forms normally seen in classical or extended SDRs. Atypical SDRs include biliverdin IX beta reductase (BVR-B,aka flavin reductase), NMRa (a negative transcriptional regulator of various fungi), progesterone 5-beta-reductase like proteins, phenylcoumaran benzylic ether and pinoresinol-lariciresinol reductases, phenylpropene synthases, eugenol synthase, triphenylmethane reductase, isoflavone reductases, and others. SDRs are a functionally diverse family of oxidoreductases that have a single domain with a structurally conserved Rossmann fold, an NAD(P)(H)-binding region, and a structurally diverse C-terminal region. Sequence identity between different SDR enzymes is typically in the 15-30% range; they catalyze a wide range of activities including the metabolism of steroids, cofactors, carbohydrates, lipids, aromatic compounds, and amino acids, and act in redox sensing. Classical SDRs have an TGXXX[AG]XG cofactor binding motif and a YXXXK active site motif, with the Tyr residue of the active site motif serving as a critical catalytic residue (Tyr-151, human 15-hydroxyprostaglandin dehydrogenase numbering). In addition to the Tyr and Lys, there is often an upstream Ser and/or an Asn, contributing to the active site; while substrate binding is in the C-terminal region, which determines specificity. The standard reaction mechanism is a 4-pro-S hydride transfer and proton relay involving the conserved Tyr and Lys, a water molecule stabilized by Asn, and nicotinamide. In addition to the Rossmann fold core region typical of all SDRs, extended SDRs have a less conserved C-terminal extension of approximately 100 amino acids, and typically have a TGXXGXXG cofactor binding motif. Complex (multidomain) SDRs such as ketoreductase domains of fatty acid synthase have a GGXGXXG NAD(P)-binding motif and an altered active site motif (YXXXN). Fungal type ketoacyl reductases have a TGXXXGX(1-2)G NAD(P)-binding motif.	1.89133e-65
NZ_CP029122.1\|WP_000646033.1\|892415_892991_-\|divisome-associated-lipoprotein-YraP	gnl\|CDD\|182907	PRK11023, PRK11023, divisome-associated lipoprotein YraP.	1.97056e-117
NZ_CP029122.1\|WP_000037608.1\|889816_890335_-\|protein/nucleic-acid-deglycase	gnl\|CDD\|153228	cd03134, GATase1_PfpI_like, A type 1 glutamine amidotransferase (GATase1)-like domain found in PfpI from Pyrococcus furiosus. A type 1 glutamine amidotransferase (GATase1)-like domain found in PfpI from Pyrococcus furiosus. This group includes proteins similar to PfpI from P. furiosus. and PH1704 from Pyrococcus horikoshii. These enzymes are ATP-independent intracellular proteases and may hydrolyze small peptides to provide a nutritional source. Only Cys of the catalytic triad typical of GATase1 domains is conserved in this group. This Cys residue is found in the sharp turn between a beta strand and an alpha helix termed the nucleophile elbow. For PH1704, it is believed that this Cys together with a different His in one monomer and Glu (from an adjacent monomer) forms a different catalytic triad from the typical GATase1domain. PfpI is homooligomeric. Protease activity is only found for oligomeric forms of PH1704.	6.06977e-86
NZ_CP029122.1\|WP_001375267.1\|888032_888557_+\|SCP2-domain-containing-protein	gnl\|CDD\|225696	COG3154, COG3154, Putative lipid carrier protein [Lipid metabolism].	8.79126e-85
NZ_CP029122.1\|WP_000044770.1\|901392_902088_-\|molecular-chaperone	gnl\|CDD\|225663	COG3121, FimC, P pilus assembly protein, chaperone PapD [Cell motility and secretion / Intracellular trafficking and secretion].	9.16141e-79
NZ_CP029122.1\|WP_000908554.1\|888550_889054_+\|N-acetyltransferase	gnl\|CDD\|225695	COG3153, COG3153, Predicted acetyltransferase [General function prediction only].	1.31299e-64
NZ_CP029122.1\|WP_000189314.1\|889040_889343_-\|DNA-damage-response-exodeoxyribonuclease-YhbQ	gnl\|CDD\|178979	PRK00329, PRK00329, GIY-YIG nuclease superfamily protein; Validated.	3.58629e-45
NZ_CP029122.1\|WP_001158034.1\|893000_893591_-\|DnaA-initiator-associating-protein-DiaA	gnl\|CDD\|182811	PRK10886, PRK10886, DnaA initiator-associating protein DiaA; Provisional.	5.61903e-143

>NZ_CP029122.1|WP_001375265.1|891170_892211_+|permease
MTGQSSSQAATPIQWWKPALFFLVVIAGLWYVKWEPYYGKAFTAAETHSIGKSILAQADANPWQAALDYAMIYFLAVWKAAVLGVILGSLIQVLIPRDWLLRTLGQSRFRGTLLGTLFSLPGMMCTCCAAPVAAGMRRQQVSMGGALAFWMGNPVLNPATLVFMGFVLSWGFAAIRLVAGLVMVLLIATLVQKWVRETPQTQAPVEIDIPEAQGGFFSRWGRALWTLFWSTIPVYILAVLVLGAARVWLFPHADGTVDNSLMWVVAMAVAGCLFVIPTAAEIPIVQTMMLAGMGTAPALALLMTLPAVSLPSLIMLRKAFPAKALWLTGAMVAVSGVIVGGLALLF
>NZ_CP029122.1|WP_001295551.1|890462_891098_+|NAD(P)H-binding-protein
MSQVLITGATGLVGGHLLRMLINEPKVNAIAAPTRRPLGDMPGVFNPHDPQLTDALAQVTDPIDIVFCCLGTTRREAGSKEAFIHADYTLVVDTALTGRRLGAQHMLVVSAMGANAHSPFFYNRVKGEMEEALIAQNWPKLTIARPSMLLGDRSKQRMNETLFAPLFRLLPGNWKSIDARDVARVMLAESMRPEHEGVTILSSSELRKRAE
>NZ_CP029122.1|WP_000037608.1|889816_890335_-|protein/nucleic-acid-deglycase
MSKKIAVLITDEFEDSEFTSPADEFRKAGHEVITIEKQAGKTVKGKKGEASVTIDKSIDEVTPAEFDALLLPGGHSPDYLRGDNRFVTFTRDFVNSGKPVFAICHGPQLLISADVIRGRKLTAVKPIIIDVKNAGAEFYDQEVVVDKDQLVTSRTPDDLPAFNREALRLLGA
>NZ_CP029122.1|WP_000449030.1|889393_889837_+|YhbP-family-protein
METLIAISRWLAKQHVVTWCVQQEGELWCANAFYLFDAQKVAFYILTEEKTRHAQMSGPQAAVAGTVNGQPKTVALIRGVQFKGEIRRLEGEESDLARKAYNRRFPVARMLSAPVWEIRLDEIKFTDNTLGFGKKMIWLRDSGTEQA
>NZ_CP029122.1|WP_000189314.1|889040_889343_-|DNA-damage-response-exodeoxyribonuclease-YhbQ
MTPWFLYLIRTADNKLYTGITTDVERRYQQHQSGKGAKALRGKGELTLAFSAPVGDRSLALRAEYRVKQLTKRQKERLVAEGAGFAELLSSLQTPEIKSD
>NZ_CP029122.1|WP_000908554.1|888550_889054_+|N-acetyltransferase
MLIRVEIPIDAPGIDALLRRSFESDAEAKLVHDLREDGFLTLGLVATDDEGQVIGYVAFSPVDVQGEDLQWVGMAPLAVDEKYRGQGLARQLVYEGLDSLNEFGYAAVVTLGDPALYSRFGFELAAHHDLRCRWPGTESAFQVHRLADDALNGVTGLVEYHEHFNRF
>NZ_CP029122.1|WP_001375267.1|888032_888557_+|SCP2-domain-containing-protein
MLDKLRSRIVHLGPSLLSVPVKLTPFALKRQVLEQVLSWQFRQALDDGELEFLEGRWLSIHVRDIDLQWFTSVVNGKLVVSQNAQADVSFSADASDLLMIAARKQDPDTLFFQRRLVIEGDTELGLYVKNLMDAIELEQMPKALRMMLLQLADFVEAGMKNAPETKQTSVGEPC
>NZ_CP029122.1|WP_000421305.1|886828_887824_-|U32-family-peptidase
MELLCPAGNLPALKAAIENGADAVYIGLKDDTNARHFAGLNFTEKKLQEAVSFVHQHRRKLHIAINTFAHPDGYARWQRAVDMAAQLGADALILADLAMLEYAAERYPHIERHVSVQASATNEEAINFYHRHFDVARVVLPRVLSIHQVKQLARVTPVPLEVFAFGSLCIMSEGRCYLSSYLTGESPNTVGACSPARFVRWQQTPQGLESRLNEVLIDRYQDGENAGYPTLCKGRYLVDGERYHALEEPTSLNTLELLPELMAANIASVKIEGRQRSPAYVSQVAKVWRQAIDRCKADPQNFVPQSAWMETLGSMSEGTQTTLGAYHRKWQ
>NZ_CP029122.1|WP_001301318.1|885941_886820_-|U32-family-peptidase
MKYSLGPVLWYWPKETLEEFYQQAATSSADVIYLGEAVCSKRRATKVGDWLEMAKSLAGSGKQIVLSTLALVQASSELGELKRYVENGEFLIEASDLGVVNMCAERKLPFVAGHALNCYNAVTLKILLKQGMMRWCMPVELSRDWLVNLLNQCDELGIRNQFEVEVLSYGHLPLAYSARCFTARSEDRPKDECETCCIKYPNGRNVLSQENQQVFVLNGIQTMSGYVYNLGNELASMQGLVDVVRLSPQGTDTFAMLDAFRANENGAAPLPLTANSDCNGYWRRLAGLELQA
>NZ_CP029122.1|WP_000130392.1|884728_885736_-|LLM-class-flavin-dependent-oxidoreductase
MTDKTIAFSLLDLAPIPEGSSAREAFSHSLDLARLAEKRGYHRYWLAEHHNMTGIASAATSVLIGYLAANTTTLHLGSGGVMLPNHSPLVIAEQFGTLNTLYPGRIDLGLGRAPGSDQRTMMALRRHMSGDIDNFPRDVAELVDWFDARDPNPNVRPVPGYGEKIPVWLLGSSLYSAQLAAQLGLPFAFASHFAPDMLFQALHLYRSNFKPSARLEKPYAMVCINIIAADSNRDAEFLFTSMQQAFVKLRRGETGQLPPPIQNMDQFWSPSEQYGVQQALSMSLVGDKAKVRHGLQSILRETDADEIMVNGQIFDHQARLHSFELAMDVKEELLG
>NZ_CP029122.1|WP_000646033.1|892415_892991_-|divisome-associated-lipoprotein-YraP
MKALSPIAVLISALLLQGCVAAAVVGTAAVGTKAATDPRSVGTQVDDGTLEVRVNSALSKDEQIKKEARINVTAYQGKVLLVGQSPNAELSARAKQIAMGVDGANEVYNEIRQGQPIGLGEASNDTWITTKVRSQLLTSDLVKSSNVKVTTENGEVFLMGLVTEREAKAAADIASRVSGVKRVTTAFTFIK
>NZ_CP029122.1|WP_001158034.1|893000_893591_-|DnaA-initiator-associating-protein-DiaA
MQERIKACFTESIQTQIAAAEALPDAISRAAMTLVQSLLNGNKILCCGNGTSAANAQHFAASMINRFETERPSLPAIALNTDNVVLTAIANDRLHDEVYAKQVRALGHAGDVLLAISTRGNSRDIVKAVEAAVTRDMTIVALTGYDGGELAGLLGPQDVEIRIPSHRSARIQEMHMLTVNCLCDLIDNTLFPHQDD
>NZ_CP029122.1|WP_000246837.1|893610_894006_-|YraN-family-protein
MATVPTRSGSPRQLTTKQTGDAWEAQARRWLEGKGLRFIAANVNERGGEIDLIMREGRTTVFVEVRYRRSALYGGAAASVTRSKQHKLLQTARLWLARHNGSFDTVDCRFDVVAFTGNEVEWIKDAFNDHS
>NZ_CP029122.1|WP_000249160.1|893963_896000_-|penicillin-binding-protein-activator-LpoA
MVPSTFSRLKAARCLPVVLAALIFAGCGTHTPDQSTAYMQGTAQADSAFYLQQMQQSSDDTRINWQLLAIRALVKEGKTGQAVELFNQLPQELNDSQRREKTLLAVEIKLAQKDFAGAQNLLAKITPADLEQNQQARYWQAKIDASQGRPSIDLLRALIAQEPLLGAKEKQQNIDATWQALSSMTQEQANTLVINADENILQGWLDLQRVWFDNRNDPDMMKAGIADWQKRYPNNPGAKMLPTQLVNVKAFKPASTNKIALLLPLNGQAAVFGRTIQQGFEAAKNIGTQPVAAQVAAAPAADVAEQPQPQTVDGVASPAQASVSDLTGEQPAAQPVPVSAPATSTAAVSAPANPSAELKIYDTSSQPLSQILSQVQQDGASIVVGPLLKNNVEELLKSNTPLNVLALNQPENIENRVNICYFALSPEDEARDAARHIRDQGKQAPLVLIPRSSLGDRVANAFAQEWQKLGGGTVLQQKFGSTSELRAGVNGGSGIALTGSPITPRATTDSGMTTNNPTLQTTPTDDQFTNNGGRVDAVYIVATPGEIAFIKPMIAMRNGSQSGATLYASSRSAQGTAGPDFRLEMEGLQYSEIPMLAGGNLPLMQQALSAVNNDYSLARMYAMGVDAWSLANHFSQMRQVQGFEINGNTGSLTANPDCVINRKLSWLQYQQGQVVPAS
>NZ_CP029122.1|WP_000809262.1|896064_896925_+|16S-rRNA-(cytidine(1402)-2'-O)-methyltransferase
MKQHQSADNSQGQLYIVPTPIGNLADITQRALEVLQAVDLIAAEDTRHTGLLLQHFGINARLFALHDHNEQQKAETLLAKLQEGQNIALVSDAGTPLINDPGYHLVRTCREAGIRVVPLPGPCAAITALSAAGLPSDRFCYEGFLPAKSKGRRDALKAIEAEPRTLIFYESTHRLLDSLEDIVAVLGESRYVVLARELTKTWETIHGAPVGELLAWVKEDENRRKGEMVLIVEGHKAQEEDLPADALRTLALLQAELPLKKAAALAAEIHGVKKNALYKYALEQQG
>NZ_CP029122.1|WP_000816988.1|896967_898059_-|fimbrial-protein
MKRAPLITGLLLISTSCAYASSGGCGADSTSGATNYSSVVDDVTVNQTDNVTGREFTSATLSSTNWQYACSCSAGKAVKLVYMVSPVLTTTGHQAGYYKLNDSLDIKTTLKANDIPGLVTDQTVSVNTRFTQIKSNTVYSAATQTGVCQGDTSRYGPVNIGANTTFTLYVTKPFLGSMTIPKTDIAVIKGAWVDGMGSPSTGDFHDLVKLSIQGNLTAPQSCKINQGDVIKVNFGFINGQKFTTRNAMPDGFTPVDFDITYDCGDTSKIKNSLQMRIDGTTGVVDQYNLVARRRSSDNAPDVGIRIENLGGGVANIPFQNGILPVDPSGHGTVNMRAWPVNLVGGELETGKFQGTATITVIVR
>NZ_CP029122.1|WP_000044770.1|901392_902088_-|molecular-chaperone
MSKRTFAVIITLLCSFCIGQALAGGIVLQRTRVIYDASRKEAALPVANKGAETPYLLQSWVDNIDGTSRAPFIITPPLFRLEAGDDSSLRIIKTADNLPENKESLFYINVRAIPAKKKSDNVNANELTLVFKTRIKMFYRPAHLKGRVNDAWKSLEFKRSDHSLNIYNPTEYYVVFAGLAVDKTDLTSKIEYIAPGEHKQLPLPASGGKNVKWAAINDYGGSSGTETRPLQ
>NZ_CP029122.1|WP_001045434.1|902167_902752_-|type-1-fimbrial-protein
MNKVTKTAIAGLLALFAGNAAATDGEIVFDGEILKSACEINDSDKKIEVALGHYNAEQFRSVGDRSPKIPFTIPLVNCPVTGWEHDNGNVEASFRLWLETRDNGTVPNFPNLAKVGSFAGTAATGVGIRIDDAESGNLMPLNAMGNDNTVYQIPADSAGIVNVDLIAYYVSTVEASEITPGEADAVVNVTLDYR
>NZ_CP029122.1|WP_001323952.1|903152_903908_-|galactosamine-6-phosphate-isomerase
MERGTASGGASLLKEFHPVQTLQQVENYTALSERASEYLLAVIRSKPDAVICLATGATPLLTYHYLVEKIHQQQVDVSQLTFVKLDEWVDLPLTMPGTCETFLQQHIVQPLGLREDQLISFRSEEINETECERVTNLIARKGGLDLCVLGLGKNGHLGLNEPGESLQPACHISQLDARTQQHEMLKTAGRPVTRGITLGLKDILNAREVLLLVTGEGKQDATERFLTAKVSTAIPASFLWLHSNFICLINT
>NZ_CP029122.1|WP_000534351.1|903908_904700_-|PTS-N-acetylgalactosamine-transporter-subunit-IID
MGSEISKKDITRLGFRSSLLQASFNYERMQAGGFTWAMLPILKKIYKDDKPGLSAAMKDNLEFINTHPNLVGFLMGLLISMEEKGENRDTIKGLKVALFGPIAGIGDAIFWFTLLPIMAGICSSFASQGNLLGPILFFAVYLLIFFLRVGWTHVGYSVGVKAIDKVRENSQMIARSATILGITVIGGLIASYVHINVVTSFAIDSTHSVALQQDFFDKVFPNILPMAYTLLMYYFLRVKKAHPVLLIGVTFVLSIVCSAFGIL

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP029122_2

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP029122_2

937163-937280

Orphan

Consensus_repeat	Method
TGCCGGATGCGATGCTGGCGCACCTTATCCGGCCTACGGG	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_CP029122_2

>merge|NZ_CP029122|2|937163-937280|CRISPRCasFinder
TGCCGGATGCGATGCTGGCGCACCTTATCCGGCCTACGGGGTGCTCAACTTGTTGATGTTGTTGTGTTTTGTACCTGATGCCGGATGCGATGCTGGCGCATCTTATCCGGCCTACGGG

>NZ_CP029122|2|2|937163-937280|CRISPRCasFinder
TGCCGGATGCGATGCTGGCGCACCTTATCCGGCCTACGGG	GTGCTCAACTTGTTGATGTTGTTGTGTTTTGTACCTGA
TGCCGGATGCGATGCTGGCGCATCTTATCCGGCCTACGGG

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP029122.1\|WP_000460519.1\|935831_937142_+\|serine-dehydratase-subunit-alpha-family-protein	unknown	unknown	gnl\|CDD\|226206
NZ_CP029122.1\|WP_000384145.1\|939891_940257_-\|DUF805-domain-containing-protein	unknown	unknown	gnl\|CDD\|225694
NZ_CP029122.1\|WP_000861734.1\|930064_932359_+\|2-ketobutyrate-formate-lyase/pyruvate-formate-lyase	unknown	unknown	gnl\|CDD\|153087
NZ_CP029122.1\|WP_001375219.1\|932372_932762_+\|enamine/imine-deaminase	unknown	unknown	gnl\|CDD\|105214
NZ_CP029122.1\|WP_000107720.1\|927465_928797_+\|threonine/serine-transporter-TdcC	unknown	unknown	gnl\|CDD\|184191
NZ_CP029122.1\|WP_000603618.1\|941605_942088_-\|DoxX-family-protein	unknown	unknown	gnl\|CDD\|225168
NZ_CP029122.1\|WP_000096086.1\|942183_942483_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|372871
NZ_CP029122.1\|WP_000031415.1\|942879_943185_-\|DUF883-domain-containing-protein	unknown	unknown	gnl\|CDD\|226941
NZ_CP029122.1\|WP_000531204.1\|940549_941536_-\|glutathionyl-hydroquinone-reductase-YqjG	unknown	unknown	gnl\|CDD\|223512
NZ_CP029122.1\|WP_000145820.1\|924884_925229_-\|DNA-binding-transcriptional-activator-TdcR	unknown	unknown	gnl\|CDD\|236909
NZ_CP029122.1\|WP_000622115.1\|932833_934198_+\|L-serine-ammonia-lyase	unknown	unknown	gnl\|CDD\|185000
NZ_CP029122.1\|WP_000104211.1\|925417_926356_+\|transcriptional-regulator-TdcA	unknown	unknown	gnl\|CDD\|182391
NZ_CP029122.1\|WP_000785722.1\|942472_942877_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|227681
NZ_CP029122.1\|WP_001297162.1\|928822_930031_+\|propionate-kinase	unknown	unknown	gnl\|CDD\|183484
NZ_CP029122.1\|WP_001041010.1\|938346_939243_+\|DNA-binding-transcriptional-regulator-YhaJ	unknown	unknown	gnl\|CDD\|176122
NZ_CP029122.1\|WP_001295544.1\|937353_937518_-\|hypothetical-protein	unknown	unknown	unknown
NZ_CP029122.1\|WP_001198780.1\|939293_939650_-\|DUF805-domain-containing-protein	unknown	unknown	gnl\|CDD\|225694
NZ_CP029122.1\|WP_000548347.1\|926454_927444_+\|bifunctional-threonine-ammonia-lyase/L-serine-ammonia-lyase-TdcB	unknown	unknown	gnl\|CDD\|236317
NZ_CP029122.1\|WP_000401598.1\|934472_935804_+\|HAAAP-family-serine/threonine-permease	unknown	unknown	gnl\|CDD\|273283
NZ_CP029122.1\|WP_000633577.1\|937540_938242_-\|pirin-family-protein	unknown	unknown	gnl\|CDD\|224655

Protein	Function_ID	Function_description	E-value
NZ_CP029122.1\|WP_000460519.1\|935831_937142_+\|serine-dehydratase-subunit-alpha-family-protein	gnl\|CDD\|226206	COG3681, COG3681, L-cysteine desulfidase [Amino acid transport and metabolism].	0
NZ_CP029122.1\|WP_000096086.1\|942183_942483_-\|hypothetical-protein	gnl\|CDD\|372871	pfam13997, YqjK, YqjK-like protein. The YqjK-like protein family includes the E. coli YqjK protein, which is functionally uncharacterized. This family of proteins is found in bacteria. Proteins in this family are approximately 100 amino acids in length. There is a single completely conserved residue R that may be functionally important.	6.11451e-20
NZ_CP029122.1\|WP_000861734.1\|930064_932359_+\|2-ketobutyrate-formate-lyase/pyruvate-formate-lyase	gnl\|CDD\|153087	cd01678, PFL1, Pyruvate formate lyase 1. Pyruvate formate lyase catalyzes a key step in anaerobic glycolysis, the conversion of pyruvate and CoenzymeA to formate and acetylCoA. The PFL mechanism involves an unusual radical cleavage of pyruvate in which two cysteines and one glycine form radicals that are required for catalysis. PFL has a ten-stranded alpha/beta barrel domain that is structurally similar to those of all three ribonucleotide reductase (RNR) classes as well as benzylsuccinate synthase and B12-independent glycerol dehydratase.	0
NZ_CP029122.1\|WP_001375219.1\|932372_932762_+\|enamine/imine-deaminase	gnl\|CDD\|105214	PRK11401, PRK11401, enamine/imine deaminase.	1.34001e-81
NZ_CP029122.1\|WP_000107720.1\|927465_928797_+\|threonine/serine-transporter-TdcC	gnl\|CDD\|184191	PRK13629, PRK13629, threonine/serine transporter TdcC; Provisional.	0
NZ_CP029122.1\|WP_000603618.1\|941605_942088_-\|DoxX-family-protein	gnl\|CDD\|225168	COG2259, COG2259, Predicted membrane protein [Function unknown].	1.8476e-29
NZ_CP029122.1\|WP_000031415.1\|942879_943185_-\|DUF883-domain-containing-protein	gnl\|CDD\|226941	COG4575, ElaB, Uncharacterized conserved protein [Function unknown].	1.46625e-41
NZ_CP029122.1\|WP_000531204.1\|940549_941536_-\|glutathionyl-hydroquinone-reductase-YqjG	gnl\|CDD\|223512	COG0435, ECM4, Predicted glutathione S-transferase [Posttranslational modification, protein turnover, chaperones].	0
NZ_CP029122.1\|WP_000145820.1\|924884_925229_-\|DNA-binding-transcriptional-activator-TdcR	gnl\|CDD\|236909	PRK11424, PRK11424, DNA-binding transcriptional activator TdcR; Provisional.	3.36123e-66
NZ_CP029122.1\|WP_000622115.1\|932833_934198_+\|L-serine-ammonia-lyase	gnl\|CDD\|185000	PRK15040, PRK15040, L-serine ammonia-lyase.	0
NZ_CP029122.1\|WP_000104211.1\|925417_926356_+\|transcriptional-regulator-TdcA	gnl\|CDD\|182391	PRK10341, PRK10341, transcriptional regulator TdcA.	0
NZ_CP029122.1\|WP_000785722.1\|942472_942877_-\|hypothetical-protein	gnl\|CDD\|227681	COG5393, COG5393, Predicted membrane protein [Function unknown].	2.73939e-60
NZ_CP029122.1\|WP_001297162.1\|928822_930031_+\|propionate-kinase	gnl\|CDD\|183484	PRK12379, PRK12379, propionate kinase.	0
NZ_CP029122.1\|WP_001041010.1\|938346_939243_+\|DNA-binding-transcriptional-regulator-YhaJ	gnl\|CDD\|176122	cd08431, PBP2_HupR, The C-terminal substrate binding domain of LysR-type transcriptional regulator, HupR, which regulates expression of the heme uptake receptor HupA; contains the type 2 periplasmic binding fold. HupR, a member of the LysR family, activates hupA transcription under low-iron conditions in the presence of hemin. The expression of many iron-uptake genes, such as hupA, is regulated at the transcriptional level by iron and an iron-binding repressor protein called Fur (ferric uptake regulation). Under iron-abundant conditions with heme, the active Fur repressor protein represses transcription of the iron-uptake gene hupA, and prevents transcriptional activation via HupR. Under low-iron conditions with heme, the Fur repressor is inactive and transcription of the hupA is allowed. This substrate-binding domain shows significant homology to the type 2 periplasmic binding proteins (PBP2), which are responsible for the uptake of a variety of substrates such as phosphate, sulfate, polysaccharides, lysine/arginine/ornithine, and histidine. The PBP2 bind their ligand in the cleft between these domains in a manner resembling a Venus flytrap. After binding their specific ligand with high affinity, they can interact with a cognate membrane transport complex comprised of two integral membrane domains and two cytoplasmically located ATPase domains. This interaction triggers the ligand translocation across the cytoplasmic membrane energized by ATP hydrolysis.	2.2986e-51
NZ_CP029122.1\|WP_000384145.1\|939891_940257_-\|DUF805-domain-containing-protein	gnl\|CDD\|225694	COG3152, COG3152, Predicted membrane protein [Function unknown].	3.68376e-42
NZ_CP029122.1\|WP_001198780.1\|939293_939650_-\|DUF805-domain-containing-protein	gnl\|CDD\|225694	COG3152, COG3152, Predicted membrane protein [Function unknown].	1.64644e-35
NZ_CP029122.1\|WP_000548347.1\|926454_927444_+\|bifunctional-threonine-ammonia-lyase/L-serine-ammonia-lyase-TdcB	gnl\|CDD\|236317	PRK08638, PRK08638, bifunctional threonine ammonia-lyase/L-serine ammonia-lyase TdcB.	0
NZ_CP029122.1\|WP_000401598.1\|934472_935804_+\|HAAAP-family-serine/threonine-permease	gnl\|CDD\|273283	TIGR00814, membrane_transport_protein_YhjV, serine transporter. The Hydroxy/Aromatic Amino Acid Permease (HAAAP) Family- serine/threonine subfamily (TC 2.A.42.2) The HAAAP family includes well characterized aromatic amino acid:H+ symport permeases and hydroxy amino acid permeases. This subfamily is specific for hydroxy amino acid transporters and includes the serine permease, SdaC, of E. coli, and the threonine permease, TdcC, of E. coli.//added GO terms, none avaialbelf or ser/thr specifically [SS 2/6/05] [Transport and binding proteins, Amino acids, peptides and amines].	2.53913e-167
NZ_CP029122.1\|WP_000633577.1\|937540_938242_-\|pirin-family-protein	gnl\|CDD\|224655	COG1741, COG1741, Pirin-related protein [General function prediction only].	1.02982e-67

>NZ_CP029122.1|WP_000460519.1|935831_937142_+|serine-dehydratase-subunit-alpha-family-protein
MFDSTLNPLWQRYILAVQEEVKPALGCTEPISLALAAAVAAAELEGPVERVEAWVSPNLMKNGLGVTVPGTGMVGLPIAAALGALGGNANAGLEVLKDATAQAIADAKALLAAGKVSVKIQEPCNEILFSRAKVWNGEKWACVTIVGGHTNIVHIETHNGVVFTQQACVAEGEQESPLTVLSRTTLAEILKFVNEVPFAAIRFILDSAKLNCALSQEGLSGKWGLHIGATLEKQCERGLLAKDLSSSIVIRTSAASDARMGGATLPAMSNSGSGNQGITATMPVVVVAEHFGADDERLARALMLSHLSAIYIHNQLPRLSALCAATTAAMGAAAGMAWLVDGRYETISMAISSMIGDVSGMICDGASNSCAMKVSTSASAAWKAVLMALDDTAVTGNEGIVAHDVEQSIANLCALASHSMQQTDRQIIEIMASKAR
>NZ_CP029122.1|WP_000401598.1|934472_935804_+|HAAAP-family-serine/threonine-permease
MEIASNKGVIADASTPAGRAGMSESEWREAIKFDSTDTGWVIMSIGMAIGAGIVFLPVQVGLMGLWVFLLSSVIGYPAMYLFQRLFINTLAESPECKDYPSVISGYLGKNWGILLGALYFVMLVIWMFVYSTAITNDSASYLHTFGVTEGLLSDSPFYGLVLICILVAISSRGEKLLFKISTGMVLTKLLVVAALGVSMVGMWHLYNVGSLPPLGLLVKNAIITLPFTLTSILFIQTLSPMVISYRSREKSIEVARHKALRAMNIAFGILFVTVFFYAVSFTLAMGHDEAVKAYEQNISALAIAAQFISGDGAAWVKVVSVILNIFAVMTAFFGVYLGFREATQGIVMNILRRKMPAEKINENLVQRGIMIFAILLAWSAIVLNAPVLSFTSICSPIFGMVGCLIPAWLVYKVPALHKYKGMSLYLIIVTGLLLCVSPFLAFS
>NZ_CP029122.1|WP_000622115.1|932833_934198_+|L-serine-ammonia-lyase
MISAFDIFKIGIGPSSSHTVGPMNAGKSFIDRLESSGLLTATSHIVVDLYGSLSLTGKGHATDVAIIMGLAGNSPQDVVIDEIPAFIELVTRSGRLPVASGAHIVDFPVAKNIIFHPEMLPRHENGMRITAWKGQEALLSKTYYSVGGGFIVEEEHFGLSHDVETSVPYDFHSAGELLKMCDYNGLSISGLMMHNELALRSKAEIDAGFARIWQVMHDGIERGMNTEGVLPGPLNVPRRAVALRRQLVSSDNISNDPMNVIDWINMYALAVSEENAAGGRVVTAPTNGACGIIPAVLAYYDKFRRPVNERSIARYFLAAGAIGALYKMNASISGAEVGCQGEIGVACSMAAAGLTELLGGSPAQVCNAAEIAMEHNLGLTCDPVAGQVQIPCIERNAINAVKAVNAARMAMRRTSAPRVSLDKVIETMYETGKDMNDKYRETSRGGLAIKVVCG
>NZ_CP029122.1|WP_001375219.1|932372_932762_+|enamine/imine-deaminase
MKKIIETQRAPGAIGPYVQGVDLGSMVFTSGQIPVCPQTGEIPADVQDQARLSLENVKAIVVAAGLSVGDIIKMTVFITDLNDFATINEVYKQFFDEHQATYPTRSYVQVARLPKDVKLEIEAIAVRSA
>NZ_CP029122.1|WP_000861734.1|930064_932359_+|2-ketobutyrate-formate-lyase/pyruvate-formate-lyase
MKVDIDTSDKLYADAWLGFKGTDWKNEINVRDFIQHNYTPYEGDESFLAEATPATTELWEKVMEGIRIENATHAPVDFDTNIATTITAHDAGYINQPLEKIVGLQTDAPLKRALHPFGGINMIKSSFHAYGREMDSEFEYLFTDLRKTHNQGVFDVYSPDMLRCRKSGVLTGLPDGYGRGRIIGDYRRVALYGISYLVRERELQFADLQSRLEKGEDLEATIRLREELAEHRHALLQIQEMAAKYGFDISRPAQNAQEAVQWLYFAYLAAVKSQNGGAMSLGRTASFLDIYIERDFKAGVLNEQQAQELIDHFIMKIRMVRFLRTPEFDSLFSGDPIWATEVIGGMGLDGRTLVTKNSFRYLHTLHTMGPAPEPNLTILWSEELPIAFKKYAAQVSIVTSSLQYENDDLMRTDFNSDDYAIACCVSPMVIGKQMQFFGARANLAKTLLYAINGGVDEKLKIQVGPKTAPLMDDVLDYDKVMDSLDHFMDWLAVQYISALNIIHYMHDKYSYEASLMALHDRDVYRTMACGIAGLSVATDSLSAIKYARVKPIRDENGLAVDFEIDGEYPQYGNNDERVDSIACDLVERFMKKIKALPTYRNAVPTQSILTITSNVVYGQKTGNTPDGRRAGTPFAPGANPMHGRDRKGAVASLTSVAKLPFTYAKDGISYTFSIVPAALGKEDPVRKTNLVGLLDGYFHHEADVEGGQHLNVNVMNREMLLDAIEHPEKYPNLTIRVSGYAVRFNALTREQQQDVISRTFTQAL
>NZ_CP029122.1|WP_001297162.1|928822_930031_+|propionate-kinase
MNEFPVVLVINCGSSSIKFSVLDASDCEVLMSGIADGINSENAFLSVNGGEPAPLAHHSYEGALKAIAFELEKRNLNDSVALIGHRIAHGGSIFTESAIITDEVIDNIRRVSPLAPLHNYANLSGIESAQQLFPGVTQVAVFDTSFHQTMAPEAYLYGLPWKYYEELGVRRYGFHGTSHRYVSQRAHSLLNLAEDDSGLVVAHLGNGASICAVRNGQSVDTSMGMTPLEGLMMGTRSGDVDFGAMSWVASQTNQSLGDLERVVNKESGLLGISGLSSDLRVLEKAWHEGHERAQLAIKTFVHRIARHIAGHAASLRRLDGIIFTGGIGENSSLIRRLVMEHLAVLGVEIDTEMNNRSNSCGERIVSSENARVICAVIPTNEEKMIALDAIHLGKVNAPAEFA
>NZ_CP029122.1|WP_000107720.1|927465_928797_+|threonine/serine-transporter-TdcC
MSTSDSIVSSQTKQSSWRKSDTTWTLGLFGTAIGAGVLFFPIRAGFGGLIPILLMLVLAYPIAFYCHRALARLCLSGSNPSGNITETVEEHFGKTGGVVITFLYFFAICPLLWIYGVTITNTFMTFWENQLGFAPLNRGFVALFLLLLMAFVIWFGKDLMVKVMSYLVWPFIASLVLISLSLIPYWNSAVIDQVDLGSLSLTGHDGILITVWLGISIMVFSFNFSPIVSSFVVSKREEYEKDFGRDFTERKCSQIISRASMLMVAVVMFFAFSCLFTLSPANMAEAKAQNIPVLSYLANHFASMTGTKTTFAITLEYAASIIALVAIFKSFFGHYLGTLEGLNGLILKFGYKGDKTKVSLGKLNTISMIFIMGSTWVVAYANPNILDLIEAMGAPIIASLLCLLPMYAIRKAPSLAKYRGRLDNVFVTVIGLLTILNIVYKLF
>NZ_CP029122.1|WP_000548347.1|926454_927444_+|bifunctional-threonine-ammonia-lyase/L-serine-ammonia-lyase-TdcB
MHITYDLPVAIDDIIEAKQRLAGRIYKTGMPRSNYFSERCKGEIFLKFENMQRTGSFKIRGAFNKLSSLTDAEKRKGVVACSAGNHAQGVSLSCAMLGIDGKVVMPKGAPKSKVAATCDYSAEVVLHGDNFNDTIAKVSEIVEMEGRIFIPPYDDPKVIAGQGTIGLEIMEDLYDVDNVIVPIGGGGLIAGIAVAIKSINPTIRVIGVQSENVHGMAASFHSGEITTHRTTGTLADGCDVSRPGNLTYEIVRELVDDIVLVSEDEIRNSMIALIQRNKVVTEGAGALACAALLSGKLDQYIQNRKTVSIISGGNIDLSRVSQITGFVDA
>NZ_CP029122.1|WP_000104211.1|925417_926356_+|transcriptional-regulator-TdcA
MSTILLPKTQHLVVFQEVIRSGSIGSAAKELGLTQPAVSKIINDIEDYFGVELVVRKNTGVTLTPAGQLLLSRSESITREMKNMVNEISGMSSEAVVEVSFGFPSLIGFTFMSGMINKFKEVFPKAQVSMYEAQLSSFLPAIRDGRLDFAIGTLSAEMKLQDLHVEPLFESEFVLVASKSRTCTGTTTLESLKNEQWVLPQTNMGYYSELLTTLQRNGISIENIVKTDSVVTIYNLVLNADFLTVIPCDMTSPFGSNQFITIPVEETLPVAQYAAVWSKNYRIKKAASVLVELAKEYSSYNGCRRRQLIEVG
>NZ_CP029122.1|WP_000145820.1|924884_925229_-|DNA-binding-transcriptional-activator-TdcR
MTGITIFYGDNIIRYVVNIKKGLRPYFKQLPDNYQAKFELNLMSKFSNFIINKPFSAINTAARHIFSRYLLENKHLFYQYFKISNTGIDHLEQLINVNFFSSDRTSFCECNRFP
>NZ_CP029122.1|WP_001295544.1|937353_937518_-|hypothetical-protein
MSKKSAKKRQPVKPVVAKEPARTAKNFGYEEMLSELEAIVADAETRLAEDEATA
>NZ_CP029122.1|WP_000633577.1|937540_938242_-|pirin-family-protein
MITTRTARQCGQADYGWLQARYTFSFGHYFDPKLLGYASLRVLNQEVLAPGAAFQPRTYPKVDILNVILDGEAEYRDSEGNHVQASAGEALLLSTQPGVSYSEHNLSKDKPLTRMQLWLDACPQRENPLIQKLALNMGKQQLIASPEGTMGSLQLRQQVWLHHIVLDKGESANFQLHGPRAYLQSIHGKFHALTHHEEKAALTCGDGAFIRDEANITLVADSPLRALLIDLPV
>NZ_CP029122.1|WP_001041010.1|938346_939243_+|DNA-binding-transcriptional-regulator-YhaJ
MAKERALTLEALRVMDAIDRRGSFAAAADELGRVPSALSYTMQKLEEELDVVLFDRSGHRTKFTNVGRMLLERGRVLLEAADKLTTDAEALARGWETHLTIVTEALVPTPAFFPLIDKLAAKANTQLAIITEVLAGAWERLEQGRADIVIAPDMHFRSSSEINSRKLYTLMNVYVAAPDHPIHQEPEPLSEVTRVKYRGIAVADTARERPVLTVQLLDKQPRLTVSTIEDKRQALLAGLGVATMPYPMVEKDIAEGRLRVVSPESTSEIDIIMAWRRDSMGEAKSWCLREIPKLFSGK
>NZ_CP029122.1|WP_001198780.1|939293_939650_-|DUF805-domain-containing-protein
MQWYLAVLKNYVGFSGRARRKEYWMFTLINAIVGAIINVIQLILGLEFPFLSLIYLAATIIPVIALCVRRLHDTDRSGAWALLYLVPIIGWLVLFVFACLEGNSGSNRYGNDPKFGSN
>NZ_CP029122.1|WP_000384145.1|939891_940257_-|DUF805-domain-containing-protein
MDWYLKVLKNYVGFRGRARRKEYWMFILVNIIFTFVLGLLDKMLGWQRAGGEGILTTIYGILVFLPWWAVQFRRLHDTDRSAWWALLFLIPFIGWLIIIVFNCQAGTPGENRFGPDPKLEP
>NZ_CP029122.1|WP_000531204.1|940549_941536_-|glutathionyl-hydroquinone-reductase-YqjG
MGQLIDGVWHDTWYDTKSTGGKFQRSASAFRNWLTADGAPGPTGTGGFIAEKDRYHLYVSLACPWAHRTLIMRKLKGLEPFISVSVVNPLMLENGWTFDDSFPGATGDTLYQHEFLYQLYLHADPHYSGRVTVPVLWDKKNHTIVSNESAEIIRMFNTAFDALGAKAGDYYPPALQTKIDELNGWIYDTVNNGVYKAGFATSQQAYDEAVAKVFESLARLEQILGQHRYLTGNQLTEADIRLWTTLVRFDPVYVTHFKCDKHRISNYLNLYGFLRDIYQMPGIAETVNFDHIRNHYFRSHKTINPTGIISIGPWQDLDEPHGRDVRFG
>NZ_CP029122.1|WP_000603618.1|941605_942088_-|DoxX-family-protein
MILSIDSNDANTAPLHKKTISSLSGAVESMMKKLEDVGVLVARILMPILFITAGWGKITGYAGTQQYMEAMGVPGFMLPLVILLEFGGGLAILFGFLTRTTALFTAGFTLLTAFLFHSNFAEGVNSLMFMKNLTISGGFLLLAITGPGAYSIDRLLNKKW
>NZ_CP029122.1|WP_000096086.1|942183_942483_-|hypothetical-protein
MSSKVERERRKAQLLSQIQQQRLDLSASRREWLEATGAYDRRWNMLLSLRSWALVGSSVMAIWTIRHPNMLVRWARRGFGVWSAWRLVKTTLKQQQLRG
>NZ_CP029122.1|WP_000785722.1|942472_942877_-|hypothetical-protein
MADTHHAQGPGKSVLGIGQRIVSIMVEMVETRLRLAVVELEEEKANLFQLLLMLGLTMLFAAFGLMSLMVLIIWAVDPQYRLNAMIATTVVLLLLALIGGIWTLRKSRKSTLLRHTRHELANDRQLLEEESREQ
>NZ_CP029122.1|WP_000031415.1|942879_943185_-|DUF883-domain-containing-protein
MSKEHTTEHLRAELKSLSDTLEEVLSSSGEKSKEELSKIRSKAEQALKQSRYRLGETGDAIAKQTRVAAARADEYVRENPWTGVGIGAAIGVVLGVLLSRR

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP029122_3

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP029122_3

1310603-1311119

Orphan

I-E

Consensus_repeat	Method
GAGTTCCCCGCGCCAGCGGGGATAAACCG	PILER-CR
GAGTTCCCCGCGCCAGCGGGGATAAACCG	CRISPRCasFinder
GAGTTCCCCGCGCCAGCGGGGATAAACCG	CRT

8 spacers

The CRISPR arrays of NZ_CP029122_3

>merge|NZ_CP029122|3|1310603-1311119|PILER-CR,CRISPRCasFinder,CRT
GAGTTCCCCGCGCCAGCGGGGATAAACCGTCCACGCTGTAACGGCCATCATTAAGTTTAGTGAGTTCCCCGCGCCAGCGGGGATAAACCGGCTGATGGTCTGGGAGTGTCCATCGGGCAACTGAGTTCCCCGCGCCAGCGGGGATAAACCGGAAGTAGGCCTGACAGTGATTGAACGCATACTGAGTTCCCCGCGCCAGCGGGGATAAACCGAGTTGGGGCGGCGCAATAACGAGACGATACGCGAGTTCCCCGCGCCAGCGGGGATAAACCGGGGAGTGGCACTTCTGGGGTAGCGGCGGCCCTGAGTTCCCCGCGCCAGCGGGGATAAACCGTCAACGCGCTCAGACGTTGCGTGAGTGAACCAGAGTTCCCCGCGCCAGCGGGGATAAACCGAAATATCCAGGGCTGGGCTGGAGGCAGACGGCGAGTTCCCCGCGCCAGCGGGGATAAACCGCCCGGAATGCATTCTGAAGGTTTGCTGTATATGAGTTCCCCGCGCCAGCGGGGATAAACCA

>NZ_CP029122|3|1|1310603-1311119|PILER-CR
GAGTTCCCCGCGCCAGCGGGGATAAACCG	TCCACGCTGTAACGGCCATCATTAAGTTTAGT
GAGTTCCCCGCGCCAGCGGGGATAAACCG	GCTGATGGTCTGGGAGTGTCCATCGGGCAACT
GAGTTCCCCGCGCCAGCGGGGATAAACCG	GAAGTAGGCCTGACAGTGATTGAACGCATACT
GAGTTCCCCGCGCCAGCGGGGATAAACCG	AGTTGGGGCGGCGCAATAACGAGACGATACGC
GAGTTCCCCGCGCCAGCGGGGATAAACCG	GGGAGTGGCACTTCTGGGGTAGCGGCGGCCCT
GAGTTCCCCGCGCCAGCGGGGATAAACCG	TCAACGCGCTCAGACGTTGCGTGAGTGAACCA
GAGTTCCCCGCGCCAGCGGGGATAAACCG	AAATATCCAGGGCTGGGCTGGAGGCAGACGGC
GAGTTCCCCGCGCCAGCGGGGATAAACCG	CCCGGAATGCATTCTGAAGGTTTGCTGTATAT
GAGTTCCCCGCGCCAGCGGGGATAAACCA

>NZ_CP029122|3|3|1310603-1311119|CRISPRCasFinder
GAGTTCCCCGCGCCAGCGGGGATAAACCG	TCCACGCTGTAACGGCCATCATTAAGTTTAGT
GAGTTCCCCGCGCCAGCGGGGATAAACCG	GCTGATGGTCTGGGAGTGTCCATCGGGCAACT
GAGTTCCCCGCGCCAGCGGGGATAAACCG	GAAGTAGGCCTGACAGTGATTGAACGCATACT
GAGTTCCCCGCGCCAGCGGGGATAAACCG	AGTTGGGGCGGCGCAATAACGAGACGATACGC
GAGTTCCCCGCGCCAGCGGGGATAAACCG	GGGAGTGGCACTTCTGGGGTAGCGGCGGCCCT
GAGTTCCCCGCGCCAGCGGGGATAAACCG	TCAACGCGCTCAGACGTTGCGTGAGTGAACCA
GAGTTCCCCGCGCCAGCGGGGATAAACCG	AAATATCCAGGGCTGGGCTGGAGGCAGACGGC
GAGTTCCCCGCGCCAGCGGGGATAAACCG	CCCGGAATGCATTCTGAAGGTTTGCTGTATAT
GAGTTCCCCGCGCCAGCGGGGATAAACCA

>NZ_CP029122|3|1|1310603-1311119|CRT
GAGTTCCCCGCGCCAGCGGGGATAAACCG	TCCACGCTGTAACGGCCATCATTAAGTTTAGT
GAGTTCCCCGCGCCAGCGGGGATAAACCG	GCTGATGGTCTGGGAGTGTCCATCGGGCAACT
GAGTTCCCCGCGCCAGCGGGGATAAACCG	GAAGTAGGCCTGACAGTGATTGAACGCATACT
GAGTTCCCCGCGCCAGCGGGGATAAACCG	AGTTGGGGCGGCGCAATAACGAGACGATACGC
GAGTTCCCCGCGCCAGCGGGGATAAACCG	GGGAGTGGCACTTCTGGGGTAGCGGCGGCCCT
GAGTTCCCCGCGCCAGCGGGGATAAACCG	TCAACGCGCTCAGACGTTGCGTGAGTGAACCA
GAGTTCCCCGCGCCAGCGGGGATAAACCG	AAATATCCAGGGCTGGGCTGGAGGCAGACGGC
GAGTTCCCCGCGCCAGCGGGGATAAACCG	CCCGGAATGCATTCTGAAGGTTTGCTGTATAT
GAGTTCCCCGCGCCAGCGGGGATAAACCA

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP029122.1\|WP_000036723.1\|1307068_1308367_+\|phosphopyruvate-hydratase	unknown	unknown	gnl\|CDD\|234617
NZ_CP029122.1\|WP_000109532.1\|1320951_1321212_-\|ferredoxin-family-protein	unknown	unknown	gnl\|CDD\|225289
NZ_CP029122.1\|WP_000021330.1\|1314857_1315643_+\|SDR-family-oxidoreductase	unknown	unknown	gnl\|CDD\|187605
NZ_CP029122.1\|WP_001324445.1\|1318575_1319355_+\|electron-transfer-flavoprotein-subunit-beta/FixA-family-protein	unknown	unknown	gnl\|CDD\|224997
NZ_CP029122.1\|WP_000046812.1\|1300009_1301311_+\|23S-rRNA-(uracil(1939)-C(5))-methyltransferase-RlmD	unknown	unknown	gnl\|CDD\|237291
NZ_CP029122.1\|WP_001130266.1\|1320359_1320935_-\|glycerol-3-phosphate-responsive-antiterminator	unknown	unknown	gnl\|CDD\|224865
NZ_CP029122.1\|WP_001199979.1\|1309591_1310263_+\|7-carboxy-7-deazaguanine-synthase-QueE	unknown	unknown	gnl\|CDD\|275126
NZ_CP029122.1\|WP_001295150.1\|1321202_1322474_-\|FAD-dependent-oxidoreductase	unknown	unknown	gnl\|CDD\|182194
NZ_CP029122.1\|WP_000059312.1\|1315712_1317167_+\|FAD-binding-oxidoreductase	unknown	unknown	gnl\|CDD\|223354
NZ_CP029122.1\|WP_000039683.1\|1311756_1313235_-\|sugar-kinase	unknown	unknown	gnl\|CDD\|212662
NZ_CP029122.1\|WP_001164578.1\|1313261_1314539_-\|MFS-transporter	unknown	unknown	gnl\|CDD\|349949
NZ_CP029122.1\|WP_000147666.1\|1317188_1318598_+\|MFS-transporter	unknown	unknown	gnl\|CDD\|340929
NZ_CP029122.1\|WP_001288227.1\|1309312_1309453_-\|hypothetical-protein	unknown	unknown	unknown
NZ_CP029122.1\|WP_000226815.1\|1301358_1303593_+\|GTP-pyrophosphokinase	unknown	unknown	gnl\|CDD\|182797
NZ_CP029122.1\|WP_001679366.1\|1308426_1309299_-\|YgcG-family-protein	unknown	unknown	gnl\|CDD\|224429
NZ_CP029122.1\|WP_001071648.1\|1304324_1305116_+\|nucleoside-triphosphate-pyrophosphohydrolase	unknown	unknown	gnl\|CDD\|236569
NZ_CP029122.1\|WP_000254738.1\|1303918_1304254_+\|endoribonuclease-MazF	unknown	unknown	gnl\|CDD\|182138
NZ_CP029122.1\|WP_001324446.1\|1319351_1320212_+\|electron-transfer-flavoprotein-subunit-alpha/FixB-family-protein	unknown	unknown	gnl\|CDD\|224936
NZ_CP029122.1\|WP_000581937.1\|1303670_1303919_+\|type-II-toxin-antitoxin-system-antitoxin-MazE	unknown	unknown	gnl\|CDD\|182082
NZ_CP029122.1\|WP_000210878.1\|1305343_1306981_+\|CTP-synthase-(glutamine-hydrolyzing)	unknown	unknown	gnl\|CDD\|235437

Protein	Function_ID	Function_description	E-value
NZ_CP029122.1\|WP_000036723.1\|1307068_1308367_+\|phosphopyruvate-hydratase	gnl\|CDD\|234617	PRK00077, eno, enolase; Provisional.	0
NZ_CP029122.1\|WP_000109532.1\|1320951_1321212_-\|ferredoxin-family-protein	gnl\|CDD\|225289	COG2440, FixX, Ferredoxin-like protein [Energy production and conversion].	3.6328e-41
NZ_CP029122.1\|WP_000021330.1\|1314857_1315643_+\|SDR-family-oxidoreductase	gnl\|CDD\|187605	cd05347, Ga5DH-like_SDR_c, gluconate 5-dehydrogenase (Ga5DH)-like, classical (c) SDRs. Ga5DH catalyzes the NADP-dependent conversion of carbon source D-gluconate and 5-keto-D-gluconate. This SDR subgroup has a classical Gly-rich NAD(P)-binding motif and a conserved active site tetrad pattern. However, it has been proposed that Arg104 (Streptococcus suis Ga5DH numbering), as well as an active site Ca2+, play a critical role in catalysis. In addition to Ga5DHs this subgroup contains Erwinia chrysanthemi KduD which is involved in pectin degradation, and is a putative 2,5-diketo-3-deoxygluconate dehydrogenase. SDRs are a functionally diverse family of oxidoreductases that have a single domain with a structurally conserved Rossmann fold (alpha/beta folding pattern with a central beta-sheet), an NAD(P)(H)-binding region, and a structurally diverse C-terminal region. Classical SDRs are typically about 250 residues long, while extended SDRs are approximately 350 residues. Sequence identity between different SDR enzymes are typically in the 15-30% range, but the enzymes share the Rossmann fold NAD-binding motif and characteristic NAD-binding and catalytic sequence patterns. These enzymes catalyze a wide range of activities including the metabolism of steroids, cofactors, carbohydrates, lipids, aromatic compounds, and amino acids, and act in redox sensing. Classical SDRs have an TGXXX[AG]XG cofactor binding motif and a YXXXK active site motif, with the Tyr residue of the active site motif serving as a critical catalytic residue (Tyr-151, human 15-hydroxyprostaglandin dehydrogenase (15-PGDH) numbering). In addition to the Tyr and Lys, there is often an upstream Ser (Ser-138, 15-PGDH numbering) and/or an Asn (Asn-107,15-PGDH numbering) contributing to the active site; while substrate binding is in the C-terminal region, which determines specificity. The standard reaction mechanism is a 4-pro-S hydride transfer and proton relay involving the conserved Tyr and Lys, a water molecule stabilized by Asn, and nicotinamide. Extended SDRs have additional elements in the C-terminal region, and typically have a TGXXGXXG cofactor binding motif. Complex (multidomain) SDRs such as ketoreductase domains of fatty acid synthase have a GGXGXXG NAD(P)-binding motif and an altered active site motif (YXXXN). Fungal type ketoacyl reductases have a TGXXXGX(1-2)G NAD(P)-binding motif. Some atypical SDRs have lost catalytic activity and/or have an unusual NAD(P)-binding motif and missing or unusual active site residues. Reactions catalyzed within the SDR family include isomerization, decarboxylation, epimerization, C=N bond reduction, dehydratase activity, dehalogenation, Enoyl-CoA reduction, and carbonyl-alcohol oxidoreduction.	1.14687e-138
NZ_CP029122.1\|WP_001324445.1\|1318575_1319355_+\|electron-transfer-flavoprotein-subunit-beta/FixA-family-protein	gnl\|CDD\|224997	COG2086, FixA, Electron transfer flavoprotein, beta subunit [Energy production and conversion].	7.46503e-62
NZ_CP029122.1\|WP_000046812.1\|1300009_1301311_+\|23S-rRNA-(uracil(1939)-C(5))-methyltransferase-RlmD	gnl\|CDD\|237291	PRK13168, rumA, 23S rRNA (uracil(1939)-C(5))-methyltransferase RlmD.	0
NZ_CP029122.1\|WP_001130266.1\|1320359_1320935_-\|glycerol-3-phosphate-responsive-antiterminator	gnl\|CDD\|224865	COG1954, GlpP, Glycerol-3-phosphate responsive antiterminator (mRNA-binding) [Transcription].	5.83077e-88
NZ_CP029122.1\|WP_000254738.1\|1303918_1304254_+\|endoribonuclease-MazF	gnl\|CDD\|182138	PRK09907, PRK09907, endoribonuclease MazF.	1.17475e-74
NZ_CP029122.1\|WP_001295150.1\|1321202_1322474_-\|FAD-dependent-oxidoreductase	gnl\|CDD\|182194	PRK10015, PRK10015, oxidoreductase; Provisional.	2.82789e-125
NZ_CP029122.1\|WP_000059312.1\|1315712_1317167_+\|FAD-binding-oxidoreductase	gnl\|CDD\|223354	COG0277, GlcD, FAD/FMN-containing dehydrogenases [Energy production and conversion].	1.25325e-82
NZ_CP029122.1\|WP_000039683.1\|1311756_1313235_-\|sugar-kinase	gnl\|CDD\|212662	cd07779, FGGY_ygcE_like, uncharacterized ygcE-like proteins. This subfamily consists of uncharacterized hypothetical bacterial proteins with similarity to Escherichia coli sugar kinase ygcE , whose functional roles are not yet clear. Escherichia coli ygcE is recognized by this model, but is not present in the alignment as it contains a deletion relative to other members of the group. These proteins belong to the FGGY family of carbohydrate kinases, the monomers of which contain two large domains, which are separated by a deep cleft that forms the active site. This model includes both the N-terminal domain, which adopts a ribonuclease H-like fold, and the structurally related C-terminal domain.	9.76816e-108
NZ_CP029122.1\|WP_001164578.1\|1313261_1314539_-\|MFS-transporter	gnl\|CDD\|349949	cd06174, MFS, Major Facilitator Superfamily. The Major Facilitator Superfamily (MFS) is a large and diverse group of secondary transporters that includes uniporters, symporters, and antiporters. MFS proteins facilitate the transport across cytoplasmic or internal membranes of a variety of substrates including ions, sugar phosphates, drugs, neurotransmitters, nucleosides, amino acids, and peptides. They do so using the electrochemical potential of the transported substrates. Uniporters transport a single substrate, while symporters and antiporters transport two substrates in the same or in opposite directions, respectively, across membranes. MFS proteins are typically 400 to 600 amino acids in length, and the majority contain 12 transmembrane alpha helices (TMs) connected by hydrophilic loops. The N- and C-terminal halves of these proteins display weak similarity and may be the result of a gene duplication/fusion event. Based on kinetic studies and the structures of a few bacterial superfamily members, GlpT (glycerol-3-phosphate transporter), LacY (lactose permease), and EmrD (multidrug transporter), MFS proteins are thought to function through a single substrate binding site, alternating-access mechanism involving a rocker-switch type of movement. Bacterial members function primarily for nutrient uptake, and as drug-efflux pumps to confer antibiotic resistance. Some MFS proteins have medical significance in humans such as the glucose transporter Glut4, which is impaired in type II diabetes, and glucose-6-phosphate transporter (G6PT), which causes glycogen storage disease when mutated.	1.84544e-29
NZ_CP029122.1\|WP_000147666.1\|1317188_1318598_+\|MFS-transporter	gnl\|CDD\|340929	cd17371, MFS_MucK, Cis,cis-muconate transport protein and similar proteins of the Major Facilitator Superfamily. This subfamily is composed of Acinetobacter sp. Cis,cis-muconate transport protein (MucK), Escherichia coli putative sialic acid transporter 1, and similar proteins. MucK functions in the uptake of muconate and allows Acinetobacter calcoaceticus ADP1 (BD413) to grow on exogenous cis,cis-muconate as the sole carbon source. The MucK subfamily belongs to the Metazoan Synaptic Vesicle Glycoprotein 2 (SV2) and related small molecule transporter family (SV2-like) of the Major Facilitator Superfamily (MFS) of membrane transport proteins. MFS proteins are thought to function through a single substrate binding site, alternating-access mechanism involving a rocker-switch type of movement.	8.50431e-51
NZ_CP029122.1\|WP_000226815.1\|1301358_1303593_+\|GTP-pyrophosphokinase	gnl\|CDD\|182797	PRK10872, relA, (p)ppGpp synthetase I/GTP pyrophosphokinase; Provisional.	0
NZ_CP029122.1\|WP_001679366.1\|1308426_1309299_-\|YgcG-family-protein	gnl\|CDD\|224429	COG1512, COG1512, Beta-propeller domains of methanol dehydrogenase type [General function prediction only].	4.46208e-100
NZ_CP029122.1\|WP_001071648.1\|1304324_1305116_+\|nucleoside-triphosphate-pyrophosphohydrolase	gnl\|CDD\|236569	PRK09562, mazG, nucleoside triphosphate pyrophosphohydrolase; Reviewed.	8.97718e-160
NZ_CP029122.1\|WP_001199979.1\|1309591_1310263_+\|7-carboxy-7-deazaguanine-synthase-QueE	gnl\|CDD\|275126	TIGR04322, organic_radical_activating_enzyme, putative 7-cyano-7-deazaguanosine (preQ0) biosynthesis protein QueE. Members of this radical SAM domain protein family appear to be the E. coli form of the queuosine biosynthesis protein QueE. QueE is involved in making preQ0 (7-cyano-7-deazaquanine), a precursor of both the bacterial/eukaryotic modified tRNA base queuosine and the archaeal modified base archaeosine. Members occur in species that lack known forms of QueE but usually are not found in queuosine biosynthesis operons. Members of this family tend to form bi-directional best hit matches to members of known (TIGR03365) and putative (TIGR03963) QueE families from other lineages.	3.23739e-155
NZ_CP029122.1\|WP_001324446.1\|1319351_1320212_+\|electron-transfer-flavoprotein-subunit-alpha/FixB-family-protein	gnl\|CDD\|224936	COG2025, FixB, Electron transfer flavoprotein, alpha subunit [Energy production and conversion].	1.47186e-88
NZ_CP029122.1\|WP_000581937.1\|1303670_1303919_+\|type-II-toxin-antitoxin-system-antitoxin-MazE	gnl\|CDD\|182082	PRK09798, PRK09798, MazF-MazE toxin-antitoxin system antitoxin MazE.	6.19513e-48
NZ_CP029122.1\|WP_000210878.1\|1305343_1306981_+\|CTP-synthase-(glutamine-hydrolyzing)	gnl\|CDD\|235437	PRK05380, pyrG, CTP synthetase; Validated.	0

>NZ_CP029122.1|WP_001199979.1|1309591_1310263_+|7-carboxy-7-deazaguanine-synthase-QueE
MQYPINEMFQTLQGEGYFTGVPAIFIRLQGCPVGCAWCDTKHTWEKLEDREVSLFSILAKTKESDKWGAASSEDLLAVISRQGYTARHVVITGGEPCIHDLLPLTDLLEKNGFSCQIETSGTHEVRCTPNTWVTVSPKLNMRGGYEVLSQALERANEIKHPVGRVRDIEALDELLATLTDDKPRVIALQPISQKDDATRLCIETCIARNWRLSMQTHKYLNIA
>NZ_CP029122.1|WP_001288227.1|1309312_1309453_-|hypothetical-protein
MSEENKENGFNHVKTFTKIIFIFSVLVFNDNESKITDAAVNLFIQI
>NZ_CP029122.1|WP_001679366.1|1308426_1309299_-|YgcG-family-protein
MRYFILMFTFVCSFVAAQPTIVPQLQQQVTDLTSSLNSQEKKELTHKLESIFNNTQVQIAVLIVPTTKDETIEQYATRVFDNWRLGDAKRNDGILIIVAWSDRTVRIKVGYGLEEKVTDALAGDIIRSNMIPAFKQQKLAQGLELAINALNNQLTSQHQYPTNPSESESASSSDHYYFAIFWVFAVMFFPFWFFHQCSNFCRACKSGVCISAIYLLDLFLFSDKIFSIAVFSFFFTFTIFMVFTCLCVLQKRASGRSYHSDNSGSAGGSDSGGFSGGGGSSGGGGASGRW
>NZ_CP029122.1|WP_000036723.1|1307068_1308367_+|phosphopyruvate-hydratase
MSKIVKIIGREIIDSRGNPTVEAEVHLEGGFVGMAAAPSGASTGSREALELRDGDKSRFLGKGVTKAVAAVNGPIAQALIGKDAKDQAGIDKIMIDLDGTENKSKFGANAILAVSLANAKAAAAAKGMPLYEHIAELNGTPGKYSMPVPMMNIINGGEHADNNVDIQEFMIQPVGAKTVKEAIRMGSEVFHHLAKVLKAKGMNTAVGDEGGYAPNLGSNAEALAVIAEAVKAAGYELGKDITLAMDCAASEFYKDGKYVLAGEGNKAFTSEEFTHFLEELTKQYPIVSIEDGLDESDWDGFAYQTKVLGDKIQLVGDDLFVTNTKILKEGIEKGIANSILIKFNQIGSLTETLAAIKMAKDAGYTAVISHRSGETEDATIADLAVGTAAGQIKTGSMSRSDRVAKYNQLIRIEEALGEKAPYNGRKEIKGQA
>NZ_CP029122.1|WP_000210878.1|1305343_1306981_+|CTP-synthase-(glutamine-hydrolyzing)
MTTNYIFVTGGVVSSLGKGIAAASLAAILEARGLNVTIMKLDPYINVDPGTMSPIQHGEVFVTEDGAETDLDLGHYERFIRTKMSRRNNFTTGRIYSDVLRKERRGDYLGATVQVIPHITNAIKERVLEGGEGHDVVLVEIGGTVGDIESLPFLEAIRQMAVEIGREHTLFMHLTLVPYMAASGEVKTKPTQHSVKELLSIGIQPDILICRSDRAVPANERAKIALFCNVPEKAVISLKDVDSIYKIPGLLKSQGLDDYICKRFSLNCPEANLSEWEQVIFEEANPVSEVTIGMVGKYIELPDAYKSVIEALKHGGLKNRVSVNIKLIDSQDVETRGVEILKGLDAILVPGGFGYRGVEGMITTARFARENNIPYLGICLGMQVALIDYARHVANMENANSTEFVPDCKYPVVALITEWRDENGNVEVRSEKSDLGGTMRLGAQQCQLVDDSLVRQLYNAPTIVERHRHRYEVNNMLLKQIEDAGLRVAGRSGDDQLVEIIEVPNHPWFVACQFHPEFTSTPRDGHPLFAGFVKAASEFQKRQAK
>NZ_CP029122.1|WP_001071648.1|1304324_1305116_+|nucleoside-triphosphate-pyrophosphohydrolase
MNQIDRLLTIMQRLRDPENGCPWDKEQTFATIAPYTLEETYEVLDAIAREDFDDLRGELGDLLFQVVFYAQMAQEEGRFDFNDICAAISDKLERRHPHVFADSSAENSSEVLARWEQIKTEERAQKAQHSALDDIPRSLPALMRAQKIQKRCANVGFDWTTLGPVVDKVYEEIDEVMYEARQAVVDQAKLEEEMGDLLFATVNLARHLGTKAEIALQKANEKFERRFREVERIVAARGLEMTGVDLETMEEVWQQVKRQEIDL
>NZ_CP029122.1|WP_000254738.1|1303918_1304254_+|endoribonuclease-MazF
MVSRYVPDMGDLIWVDFDPTKGSEQAGHRPAVVLSPFMYNNKTGMCLCVPCTTQSKGYPFEVVLSGQERDGVALADQVKSIAWRARGATKKGTVAPEELQLIKAKINVLIG
>NZ_CP029122.1|WP_000581937.1|1303670_1303919_+|type-II-toxin-antitoxin-system-antitoxin-MazE
MIHSSVKRWGNSPAVRIPATLMQALNLNIDDEVKIDLVDGKLIIEPVRKEPVFTLAELVNDITPENLHENIDWGEPKDKEVW
>NZ_CP029122.1|WP_000226815.1|1301358_1303593_+|GTP-pyrophosphokinase
MVAVRSAHINKAGEFDPEKWIASLGITSQKSCECLAETWAYCLQQTQGHPDASLLLWRGVEMVEILSTLSMDIDTLRAALLFPLADANVVSEDVLRESVGKSVVNLIHGVRDMAAIRQLKATHTDSVSSEQVDNVRRMLLAMVDDFRCVVIKLAERIAHLREVKDAPEDERVLAAKECTNIYAPLANRLGIGQLKWELEDYCFRYLHPTEYKRIAKLLHERRLDREHYIEEFVGHLRAEMKAEGVKAEVYGRPKHIYSIWRKMQKKNLAFDELFDVRAVRIVAERLQDCYAALGIVHTHYRHLPDEFDDYVANPKPNGYQSIHTVVLGPGGKTVEIQIRTKQMHEDAELGVAAHWKYKEGAAAGGARSGHEDRIAWLRKLIAWQEEMADSGEMLDEVRSQVFDDRVYVFTPKGDVVDLPAGSTPLDFAYHIHSDVGHRCIGAKIGGRIVPFTYQLQMGDQIEIITQKQPNPSRDWLNPNLGYVTTSRGRSKIHAWFRKQDRDKNILAGRQILDDELEHLGISLKEAEKHLLPRYNFNDVDELLAAIGGGDIRLNQMVNFLQSQFNKPSAEEQDAAALKQLQQKSYTPQNRSKDNGRVVVEGVGNLMHHIARCCQPIPGDEIVGFITQGRGISVHRADCEQLAELRSHAPERIVDAVWGESYSAGYSLVVRVVANDRSGLLRDITTILANEKVNVLGVASRSDTKQQLATIDMTIEIYNLQVLGRVLGKLNQVPDVIDARRLHGS
>NZ_CP029122.1|WP_000046812.1|1300009_1301311_+|23S-rRNA-(uracil(1939)-C(5))-methyltransferase-RlmD
MAQFYSAKRRTTTRQIITVSVNDLDSFGQGVARHNGKTLFIPGLLPQENAEVTVTEDKKQYARAKVVRRLSDSPERETPRCPHFGVCGGCQQQHASVDLQQRSKSAALARLMKHDVSEVIADVPWGYRRRARLSLNYLPKTQQLQMGFRKAGSSDIVDVKQCPILAPQLEALLPKVRACLGSLQAMRHLGHVELVQATSGTLMILRHTAPLSSADREKLERFSHSEGLDLYLAPDSEILETVSGEMPWYDSNGLRLTFSPRDFIQVNAGVNQKMVARALEWLDVQPEDRVLDLFCGMGNFTLPLATQAASVVGVEGVPALVEKGQQNARLNGLQNVTFYHENLEEDVTKQPWAKNGFDKVLLDPARAGAAGVMQQIIKLEPIRIVYVSCNPATLARDSEALLKAGYTIARLAMLDMFPHTGHLESMVLFSRVK
>NZ_CP029122.1|WP_000039683.1|1311756_1313235_-|sugar-kinase
MSKKYIIGIDGGSQSTKVVMYDLEGNVVCEGKGLLQPMHTPDADTAEHPDDDLWASLCFAGHDLMSQFAGNKEDIVGIGLGSIRCCRALLKADGTPAAPLISWQDARVTRPYEHTNPDVAYVTSFSGYLTHRLTGEFKDNIANYFGQWPVDYKSWAWSEDAAVMDKFNIPRHMLFDVQMPGTVLGHITPQAALATHFPAGLPVVCTTSDKPVEALGAGLLDDETAVISLGTYIALMMNGKALPKDPVAYWPIMSSIPQTLLYEGYGIRKGMWTVSWLRDMLGESLIQDAKAQDLSPEDLLNKKASCVPPGCNGLMTVLDWLTNPWEPYKRGIMIGFDSSMDYAWIYRSILESVALTLKNNYDNMCNEMNYFAKHVIITGGGSNSDLFMQIFADVFNLPARRNAINGCASLGAAINTAVGLGLYPDYATAVDKMVRVKDIFMPVESNAKRYDAMNKGIFKDLTKHTDVILKKSYEVMHGELGNADSIQSWSNA
>NZ_CP029122.1|WP_001164578.1|1313261_1314539_-|MFS-transporter
MQHNSYRRWITLAIISFSGGVSFDLAYLRYIYQIPMAKFMGFSNTEIGLIMSTFGIAAIILYAPSGVIADKFSHRKMITSAMIITGLLGLLMATYPPLWVMLCIQVAFAITTILMLWSVSIKAASLLGDHSEQGKIMGWMEGLRGVGVMSLAVFTMWVFSRFAPDDSTSLKTVIIIYSVVYILLGILCWFFVSDNNNLRSANNEEKQSFQLSDILAVLRISTTWYCSMVIFGVFTIYAILSYSTNYLTEMYGMSLVAASYMGIVINKIFRALCGPLGGIITTYSKVKSPTRVIQILSIIGLLALTALLVTNSNPQSVAMGIGLILLLGFTCYASRGLYWACPGEARTPSYIMGTTVGICSVIGFLPDVFVYPIIGHWQDTLPAAEAYRNMWLMGMAALGMVIVFTFLLFQKIRTADSAPAMASSK
>NZ_CP029122.1|WP_000021330.1|1314857_1315643_+|SDR-family-oxidoreductase
MSIESLNAFSMDFFSLKGKTAIVTGGNSGLGQAFAMALAKAGANIFIPSFVKDNGETKEMIEKQGVEVDFMQVDITAEGAPQKIIAASCERFGTVDILVNNAGICKLNKVLDFGRADWDPMIDVNLTAAFELSYEAAKIMIPQKSGKIINICSLFSYLGGQWSPAYSATKHALAGFTKAYCDELGQYNIQVNGIAPGYYATDITLATRSNPETNQRVLDHIPANRWGDTQDLMGAAVFLASPASNYVNGHLLVVDGGYLVR
>NZ_CP029122.1|WP_000059312.1|1315712_1317167_+|FAD-binding-oxidoreductase
MSLSRAAIVDQLKEIVGADRVITDETVLKKNSIDRFRKFPDIHGIYTLPIPAAVVKLGSTEQVSRVLNFMNAHKINGVPRTGASATEGGLETVVENSVVLDGSAMNQIINIDIENMQATAQCGVPLEVLENALREKGYTTGHSPQSKPLAQMGGLVATRSIGQFSTLYGAIEDMVVGLEAVLADGTVTRIKNVPRRAAGPDIRHIIIGNEGALCYITEVTVKIFKFTPENNLFYGYILEDMKTGFNILREVMVEGYRPSIARLYDAEDGTQHFTHFADGKCVLIFMAEGNPRIAKATGEGIAEIVARYPQCQRVDSKLIETWFNNLNWGPDKVAAERVQILKTGNMGFTTEVSGCWSCIHEIYESVINRIRTEFPHADDITMLGGHSSHSYQNGTNMYFVYDYNVVDCKPEEEIDKYHNPLNKIICEETIRLGGSMVHHHGIGKHRVHWSKLEHGSAWALLEGLKKQFDPNGIMNTGTIYPIEK
>NZ_CP029122.1|WP_000147666.1|1317188_1318598_+|MFS-transporter
MTGRCLFGFSGEKPFLLPDNEGVKMNTSPVRMDDLPLNRFHCRIAALTFGAHLTDGYVLGVIGYAIIQLTPAMQLTPFMAGMIGGSALLGLFLGSLVLGWISDHIGRQKIFTFSFLLITLASFLQFFATTPEHLIGLRILIGIGLGGDYSVGHTLLAEFSPRRHRGILLGAFSVVWTVGYVLASIAGHHFISENPEAWRWLLASAALPALLITLLRWGTPESPRWLLRQGRFAEAHAIVHRYFGPHVLLGDEVVTATHKHIKTLFSSRYWRRTAFNSVFFVCLVIPWFVIYTWLPTIAQTIGLEDALTASLMLNALLIVGALLGLVLTHLLAHRKFLLGSFLLLAATLVVMACLPSGSSLTLLLFVLFSTTISAVSNLVGILPAESFPTDIRSLGVGFATAMSRLGAAVSTGLLPWVLAQWGMQVTLLLLATVLLVGFVVTWLWAPETKALPLVAAGNVGGANEHSVSV
>NZ_CP029122.1|WP_001324445.1|1318575_1319355_+|electron-transfer-flavoprotein-subunit-beta/FixA-family-protein
MNILLAFKAEPDAGMLAEKEWQAAAQGKSGPDISLLRSLLGADEQAAAALLLAQRKNGTPMSLTALSMGDERALHWLRYLMALGFEEAVLLETAADLRFAPEFVARHIAEWQHQNPLDLIITGCQSSEGQNGQTPFLLAEMLGWPCFTQVERFTLDALFITLEQRTEHGLRCCRVRLPAVIAVRQCGEVALPVPGMRQRMAAGKAEIIRKTVAAEMPAMQCLQLARAEQRRGATLIDGQTVAEKAQKLWRDYLRQRMQP
>NZ_CP029122.1|WP_001324446.1|1319351_1320212_+|electron-transfer-flavoprotein-subunit-alpha/FixB-family-protein
MNIAIVTINQENAAIASWLAAQDFSGCTLAHWQIEPQPVVAEQVLDALVEQWQRTPADVVLFPPGTFGDELSTRLAWRLHGASICQVTSLDIPTVSVRKSHWGNALTATLQTEKRPLCLSLARQAGAAKNATLPSGMQQLIIVPGALPDWLVSTEDLKNVTRDPLAEARRVLVVGQGGEADNQEIAMLAEKLGAEVGYSRARVMNGGVDAEKVIGISGHLLAPEVCIVVGASGAAALMAGVRNSKFVVAINHDASAAVFSQADVGVVDDWKVVLEALVTNIHADCQ
>NZ_CP029122.1|WP_001130266.1|1320359_1320935_-|glycerol-3-phosphate-responsive-antiterminator
MPLLHLLRQNPVIAAVKDNASLQLAIDSECQFISVLYGNICTISNIVKKIKNAGKYAFIHVDLLEGASNKEVVIQFLKLVTEADGIISTKASMLKAARAEGFFCIHRLFIVDSISFHNIDKQVAQSNPDCIEILPGCMPKVLGWVTEKIRQPLIAGGLVCDEEDARNAINAGVVALSTTNTGVWTLAKKLL
>NZ_CP029122.1|WP_000109532.1|1320951_1321212_-|ferredoxin-family-protein
MSVARNLWRVADAPHIVPADSVERQTAERLISACPAGLFSLTPEGDLRIDYRSCLECGTCRLLCDESTLQQWRYPPSGFGITYRFG
>NZ_CP029122.1|WP_001295150.1|1321202_1322474_-|FAD-dependent-oxidoreductase
MEDDCDIIIIGAGIAGTACALRCARAGLSVLLLERAEIPGSKNLSGGRLYTHALAELLPQFHLTAPLERCITHESLSLLTPDGATTFSSLQPGGESWSVLRARFDPWLVAEAEKEGVECIPGATVDALYEENGRVCGVICGDDILRARYVVLAEGANSVLAERHGLVTRPAGEAMALGIKEVLSLETSAIEERFHLENNEGAALLFSGGICDDLPGGAFLYTNQQTLSLGIVCPLSSLTQSRVPASELLTRFKAHPAVRPLIKNTESLEYGAHLVPEGGLHSMPVQYAGNGWLLVGDALRSCVNTGISVRGMDMALTGAQAAAQTLISACQHREPQNLFPLYHHNVERSLLWDVLQRYQHVPALLQRPGWYRTWPALMQDISRDLWDQGDKPVPPLRQLFWHHLRRHGLWHLAGDVIRSLRCL

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP029122_4

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP029122_4

1333504-1334082

Unclear

I-E

Consensus_repeat	Method
TGTGTTCCCCGCGCCAGCGGGGATAAACCG	CRISPRCasFinder
GTGTTCCCCGCGCCAGCGGGGATAAACC	PILER-CR
GTGTTCCCCGCGCCAGCGGGGATAAACCG	CRT

9 spacers

cas2,cas1,cas6e,cas5

The CRISPR arrays of NZ_CP029122_4

>merge|NZ_CP029122|4|1333504-1334082|CRISPRCasFinder,PILER-CR,CRT
TGTGTTCCCCGCGCCAGCGGGGATAAACCGTTGCCCGCGCAATTCCGGGAGCATCCGCAATTGTGTTCCCCGCGCCAGCGGGGATAAACCGACGGACAAAATATATATTGATTTGCGAATTATGTGTTCCCCGCGCCAGCGGGGATAAACCGGTAAAGAAACTGCCGACAAATCCCTGTTCGTTGTGTTCCCCGCGCCAGCGGGGATAAACCGCCCGTCACCGACGCGCAGTGGCGCTACCGTGAGTGTTCCCCGCGCCAGCGGGGATAAACCGGGATCTAACGCGCTGTAAAAATTCCGTGCTTTGTGTTCCCCGCGCCAGCGGGGATAAACCATGCGGATTACCGGCAAAACATGGGAGCAAACCGTGTTCCCCGCGCCAGCGGGGATAAACCGCCGAACGGCTGGCGAAGCAGGTGGCTGGCGTAGTGTTCCCCGCGCCAGCGGGGATAAACCGGTTTACCGCCCCGCAGAGGCGCTGGCAGATCCGTGTTCCCCGCGCCAGCGGGGATAAACCGGGATGACCTGTCGCTAAAACTCGCCGCGTACAGTGTTCCCCGCGCCAGCGGGGATAAACCG

>NZ_CP029122|4|4|1333504-1334082|CRISPRCasFinder
TGTGTTCCCCGCGCCAGCGGGGATAAACCG	TTGCCCGCGCAATTCCGGGAGCATCCGCAAT
TGTGTTCCCCGCGCCAGCGGGGATAAACCG	ACGGACAAAATATATATTGATTTGCGAATTA
TGTGTTCCCCGCGCCAGCGGGGATAAACCG	GTAAAGAAACTGCCGACAAATCCCTGTTCGT
TGTGTTCCCCGCGCCAGCGGGGATAAACCG	CCCGTCACCGACGCGCAGTGGCGCTACCGTG
AGTGTTCCCCGCGCCAGCGGGGATAAACCG	GGATCTAACGCGCTGTAAAAATTCCGTGCTT
TGTGTTCCCCGCGCCAGCGGGGATAAACCA	TGCGGATTACCGGCAAAACATGGGAGCAAAC
CGTGTTCCCCGCGCCAGCGGGGATAAACCG	CCGAACGGCTGGCGAAGCAGGTGGCTGGCGT
AGTGTTCCCCGCGCCAGCGGGGATAAACCG	GTTTACCGCCCCGCAGAGGCGCTGGCAGATC
CGTGTTCCCCGCGCCAGCGGGGATAAACCG	GGATGACCTGTCGCTAAAACTCGCCGCGTAC
AGTGTTCCCCGCGCCAGCGGGGATAAACCG

>NZ_CP029122|4|2|1333505-1334081|PILER-CR
GTGTTCCCCGCGCCAGCGGGGATAAACC	GTTGCCCGCGCAATTCCGGGAGCATCCGCAATT
GTGTTCCCCGCGCCAGCGGGGATAAACC	GACGGACAAAATATATATTGATTTGCGAATTAT
GTGTTCCCCGCGCCAGCGGGGATAAACC	GGTAAAGAAACTGCCGACAAATCCCTGTTCGTT
GTGTTCCCCGCGCCAGCGGGGATAAACC	GCCCGTCACCGACGCGCAGTGGCGCTACCGTGA
GTGTTCCCCGCGCCAGCGGGGATAAACC	GGGATCTAACGCGCTGTAAAAATTCCGTGCTTT
GTGTTCCCCGCGCCAGCGGGGATAAACC	ATGCGGATTACCGGCAAAACATGGGAGCAAACC
GTGTTCCCCGCGCCAGCGGGGATAAACC	GCCGAACGGCTGGCGAAGCAGGTGGCTGGCGTA
GTGTTCCCCGCGCCAGCGGGGATAAACC	GGTTTACCGCCCCGCAGAGGCGCTGGCAGATCC
GTGTTCCCCGCGCCAGCGGGGATAAACC	GGGATGACCTGTCGCTAAAACTCGCCGCGTACA
GTGTTCCCCGCGCCAGCGGGGATAAACC

>NZ_CP029122|4|2|1333505-1334082|CRT
GTGTTCCCCGCGCCAGCGGGGATAAACCG	TTGCCCGCGCAATTCCGGGAGCATCCGCAATT
GTGTTCCCCGCGCCAGCGGGGATAAACCG	ACGGACAAAATATATATTGATTTGCGAATTAT
GTGTTCCCCGCGCCAGCGGGGATAAACCG	GTAAAGAAACTGCCGACAAATCCCTGTTCGTT
GTGTTCCCCGCGCCAGCGGGGATAAACCG	CCCGTCACCGACGCGCAGTGGCGCTACCGTGA
GTGTTCCCCGCGCCAGCGGGGATAAACCG	GGATCTAACGCGCTGTAAAAATTCCGTGCTTT
GTGTTCCCCGCGCCAGCGGGGATAAACCA	TGCGGATTACCGGCAAAACATGGGAGCAAACC
GTGTTCCCCGCGCCAGCGGGGATAAACCG	CCGAACGGCTGGCGAAGCAGGTGGCTGGCGTA
GTGTTCCCCGCGCCAGCGGGGATAAACCG	GTTTACCGCCCCGCAGAGGCGCTGGCAGATCC
GTGTTCCCCGCGCCAGCGGGGATAAACCG	GGATGACCTGTCGCTAAAACTCGCCGCGTACA
GTGTTCCCCGCGCCAGCGGGGATAAACCG

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP029122.1\|WP_001090386.1\|1336362_1337790_+\|sulfate-adenylyltransferase-subunit-CysN	unknown	unknown	gnl\|CDD\|235349
NZ_CP029122.1\|WP_001290706.1\|1325031_1326744_+\|assimilatory-sulfite-reductase-(NADPH)-hemoprotein-subunit	unknown	unknown	gnl\|CDD\|237402
NZ_CP029122.1\|WP_000372108.1\|1335452_1336361_+\|sulfate-adenylyltransferase-subunit-CysD	unknown	unknown	gnl\|CDD\|235375
NZ_CP029122.1\|WP_000956458.1\|1327816_1327969_+\|type-I-toxin-antitoxin-system-Hok-family-toxin	unknown	unknown	gnl\|CDD\|366840
NZ_CP029122.1\|WP_000063176.1\|1333114_1333408_+\|type-I-E-CRISPR-associated-endoribonuclease-Cas2	cas2	cd09648_cas2_CAS-I-E	gnl\|CDD\|236930
NZ_CP029122.1\|WP_001295150.1\|1321202_1322474_-\|FAD-dependent-oxidoreductase	unknown	unknown	gnl\|CDD\|182194
NZ_CP029122.1\|WP_000987944.1\|1322551_1322917_-\|6-carboxytetrahydropterin-synthase-QueD	unknown	unknown	gnl\|CDD\|238264
NZ_CP029122.1\|WP_000039842.1\|1326817_1327552_+\|phosphoadenosine-phosphosulfate-reductase	unknown	unknown	gnl\|CDD\|234997
NZ_CP029122.1\|WP_000490426.1\|1334163_1335201_-\|alkaline-phosphatase-isozyme-conversion-aminopeptidase	unknown	unknown	gnl\|CDD\|182299
NZ_CP029122.1\|WP_000246138.1\|1339291_1340002_+\|2-C-methyl-D-erythritol-4-phosphate-cytidylyltransferase	unknown	unknown	gnl\|CDD\|234670
NZ_CP029122.1\|WP_000144861.1\|1332194_1333118_+\|type-I-E-CRISPR-associated-endonuclease-Cas1	cas1	cd09719_cas1_CAS-I-E	gnl\|CDD\|274693
NZ_CP029122.1\|WP_000568943.1\|1340477_1341527_+\|tRNA-pseudouridine(13)-synthase-TruD	unknown	unknown	gnl\|CDD\|234884
NZ_CP029122.1\|WP_001374730.1\|1340001_1340481_+\|2-C-methyl-D-erythritol-2,4-cyclodiphosphate-synthase	unknown	unknown	gnl\|CDD\|178851
NZ_CP029122.1\|WP_001246104.1\|1338444_1338768_+\|DUF3561-family-protein	unknown	unknown	gnl\|CDD\|371891
NZ_CP029122.1\|WP_000211954.1\|1323232_1325032_+\|NADPH-dependent-assimilatory-sulfite-reductase-flavoprotein-subunit	unknown	unknown	gnl\|CDD\|182862
NZ_CP029122.1\|WP_000517476.1\|1338961_1339273_+\|cell-division-protein-FtsB	unknown	unknown	gnl\|CDD\|179156
NZ_CP029122.1\|WP_000281446.1\|1331547_1332198_+\|type-I-E-CRISPR-associated-protein-Cas6/Cse3/CasE	cas6e	cd09664_cas6e_CAS-I-E	gnl\|CDD\|273869
NZ_CP029122.1\|WP_001173673.1\|1337789_1338395_+\|adenylyl-sulfate-kinase	unknown	unknown	gnl\|CDD\|179661
NZ_CP029122.1\|WP_000085051.1\|1330819_1331566_+\|type-I-E-CRISPR-associated-protein-Cas5/CasD	cas5	cd09645_cas5_CAS-I-E	gnl\|CDD\|187776
NZ_CP029122.1\|WP_001374723.1\|1341507_1342269_+\|5'/3'-nucleotidase-SurE	unknown	unknown	gnl\|CDD\|234732

Protein	Function_ID	Function_description	E-value
NZ_CP029122.1\|WP_001090386.1\|1336362_1337790_+\|sulfate-adenylyltransferase-subunit-CysN	gnl\|CDD\|235349	PRK05124, cysN, sulfate adenylyltransferase subunit 1; Provisional.	0
NZ_CP029122.1\|WP_001290706.1\|1325031_1326744_+\|assimilatory-sulfite-reductase-(NADPH)-hemoprotein-subunit	gnl\|CDD\|237402	PRK13504, PRK13504, NADPH-dependent assimilatory sulfite reductase hemoprotein subunit.	0
NZ_CP029122.1\|WP_000372108.1\|1335452_1336361_+\|sulfate-adenylyltransferase-subunit-CysD	gnl\|CDD\|235375	PRK05253, PRK05253, sulfate adenylyltransferase subunit CysD.	0
NZ_CP029122.1\|WP_000956458.1\|1327816_1327969_+\|type-I-toxin-antitoxin-system-Hok-family-toxin	gnl\|CDD\|366840	pfam01848, HOK_GEF, Hok/gef family.	8.32243e-12
NZ_CP029122.1\|WP_000063176.1\|1333114_1333408_+\|type-I-E-CRISPR-associated-endoribonuclease-Cas2	gnl\|CDD\|236930	PRK11558, PRK11558, putative ssRNA endonuclease; Provisional.	2.35543e-65
NZ_CP029122.1\|WP_001295150.1\|1321202_1322474_-\|FAD-dependent-oxidoreductase	gnl\|CDD\|182194	PRK10015, PRK10015, oxidoreductase; Provisional.	2.82789e-125
NZ_CP029122.1\|WP_000987944.1\|1322551_1322917_-\|6-carboxytetrahydropterin-synthase-QueD	gnl\|CDD\|238264	cd00470, PTPS, 6-pyruvoyl tetrahydropterin synthase (PTPS). Folate derivatives are essential cofactors in the biosynthesis of purines, pyrimidines, and amino acids, as well as formyl-tRNA. Mammalian cells are able to utilize pre-formed folates after uptake by a carrier-mediated active transport system. Most microbes and plants lack this system and must synthesize folates de novo from guanosine triphosphate. One enzyme from this pathway is PTPS which catalyzes the conversion of dihydroneopterin triphosphate to 6-pyruvoyl tetrahydropterin. The functional enzyme is a hexamer of identical subunits.	9.8593e-60
NZ_CP029122.1\|WP_000039842.1\|1326817_1327552_+\|phosphoadenosine-phosphosulfate-reductase	gnl\|CDD\|234997	PRK02090, PRK02090, phosphoadenylyl-sulfate reductase.	1.33579e-136
NZ_CP029122.1\|WP_000490426.1\|1334163_1335201_-\|alkaline-phosphatase-isozyme-conversion-aminopeptidase	gnl\|CDD\|182299	PRK10199, PRK10199, alkaline phosphatase isozyme conversion aminopeptidase; Provisional.	0
NZ_CP029122.1\|WP_000246138.1\|1339291_1340002_+\|2-C-methyl-D-erythritol-4-phosphate-cytidylyltransferase	gnl\|CDD\|234670	PRK00155, ispD, D-ribitol-5-phosphate cytidylyltransferase.	3.26939e-121
NZ_CP029122.1\|WP_000144861.1\|1332194_1333118_+\|type-I-E-CRISPR-associated-endonuclease-Cas1	gnl\|CDD\|274693	TIGR03638, cas1_ECOLI, CRISPR-associated endonuclease Cas1, subtype I-E/ECOLI. The CRISPR-associated protein Cas1 is virtually universal to CRISPR systems. CRISPR, an acronym for Clustered Regularly Interspaced Short Palindromic Repeats, is prokaryotic immunity system for foreign DNA, mostly from phage. CRISPR systems belong to different subtypes, distinguished by both nature of the repeats, the makeup of the cohort of associated Cas proteins, and by molecular phylogeny within the more universal Cas proteins such as this one. This model is of type EXCEPTION and provides more specific information than the EQUIVALOG model TIGR00287. It describes the Cas1 protein particular to the ECOLI subtype of CRISPR/Cas system.	6.67486e-158
NZ_CP029122.1\|WP_000568943.1\|1340477_1341527_+\|tRNA-pseudouridine(13)-synthase-TruD	gnl\|CDD\|234884	PRK00984, truD, tRNA pseudouridine synthase D; Reviewed.	0
NZ_CP029122.1\|WP_001374730.1\|1340001_1340481_+\|2-C-methyl-D-erythritol-2,4-cyclodiphosphate-synthase	gnl\|CDD\|178851	PRK00084, ispF, 2-C-methyl-D-erythritol 2,4-cyclodiphosphate synthase; Reviewed.	3.39469e-104
NZ_CP029122.1\|WP_001246104.1\|1338444_1338768_+\|DUF3561-family-protein	gnl\|CDD\|371891	pfam12084, DUF3561, Protein of unknown function (DUF3561). This family of proteins is functionally uncharacterized. This protein is found in bacteria. Proteins in this family are about 110 amino acids in length.	1.22003e-52
NZ_CP029122.1\|WP_000211954.1\|1323232_1325032_+\|NADPH-dependent-assimilatory-sulfite-reductase-flavoprotein-subunit	gnl\|CDD\|182862	PRK10953, cysJ, NADPH-dependent assimilatory sulfite reductase flavoprotein subunit.	0
NZ_CP029122.1\|WP_000517476.1\|1338961_1339273_+\|cell-division-protein-FtsB	gnl\|CDD\|179156	PRK00888, ftsB, cell division protein FtsB; Reviewed.	5.55235e-62
NZ_CP029122.1\|WP_000281446.1\|1331547_1332198_+\|type-I-E-CRISPR-associated-protein-Cas6/Cse3/CasE	gnl\|CDD\|273869	TIGR01907, CRISPR_system_Cascade_subunit_CasE, CRISPR-associated protein Cas6/Cse3/CasE, subtype I-E/ECOLI. CRISPR is a term for Clustered, Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This model family, represented by CT1974 from Chlorobium tepidum, is found in the Ecoli subtype of CRISPR/Cas regions and is designated Cse3 (CRISPR/Cas Subtype Ecoli protein 3). The representative of this family from Thermus thermophilus HB8 (TTHB192) has been crystallized and found to have a structure consisting of two domains with opposing parallel beta-sheets known as a beta-sheet platform. This structure is similar to those found in the Sex-lethal protein and poly(A)-binding protein. This structure is consistent with an RNA-binding function.	1.0289e-91
NZ_CP029122.1\|WP_001173673.1\|1337789_1338395_+\|adenylyl-sulfate-kinase	gnl\|CDD\|179661	PRK03846, PRK03846, adenylylsulfate kinase; Provisional.	7.34447e-148
NZ_CP029122.1\|WP_000085051.1\|1330819_1331566_+\|type-I-E-CRISPR-associated-protein-Cas5/CasD	gnl\|CDD\|187776	cd09645, Cas5_I-E, CRISPR/Cas system-associated RAMP superfamily protein Cas5. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas5 is a RAMP superfamily protein; Subunit of the Cascade complex.	5.83917e-49
NZ_CP029122.1\|WP_001374723.1\|1341507_1342269_+\|5'/3'-nucleotidase-SurE	gnl\|CDD\|234732	PRK00346, surE, 5'(3')-nucleotidase/polyphosphatase; Provisional.	5.52694e-150

>NZ_CP029122.1|WP_000063176.1|1333114_1333408_+|type-I-E-CRISPR-associated-endoribonuclease-Cas2
MSMVVVVTENVPPRLRGRLAIWLLEVRAGVYVGDTSKRIREMIWQQITQLAGCGNVVMAWATNTESGFEFQTWGENRRIPVDLDGLRLVSFLPVDNQ
>NZ_CP029122.1|WP_000144861.1|1332194_1333118_+|type-I-E-CRISPR-associated-endonuclease-Cas1
MTFVPLSPIPLKDRTSMIFLQYGQIDVLDGAFVLIDKTGIRTHIPVGSVACIMLEPGTRVSHAAVHLAATVGTLLVWVGEAGVRVYSSGQPGGARADKLLYQAKLALTEDLRLKVVRKMYELRFREPPPARRSVEQLRGIEGSRVRQTYALLAKQYGVKWNGRKYDPKDWEKGDVVNRCISAATSCLYGISEAAVLAAGYAPAIGFIHSGKPLSFVYDIADIIKFDSVVPKAFEIAARQPAEPDKEVRLACRDIFRSTKLTGKLIPLIEEVLAAGEIEPPQPAPDMLPPAIPEPETLGDSGHRGRGG
>NZ_CP029122.1|WP_000281446.1|1331547_1332198_+|type-I-E-CRISPR-associated-protein-Cas6/Cse3/CasE
MYLSRITLHTGQLSPAQLLHLVDRGEYVMHQWLWDLFPGGKERQFLYRREELQGAFRFFVLSQERPAESDTFTIECRSFAPELRTGQQLCFNLRANPTICKSGKRHDLLMEAKRQVRGQAEGSDVWLHQQQAALDWLAAQGERSGFTLLDTSVDAYRQQQLRRENSRQLIQFSSVDYTGMLTVTDPGLFLQRLSQGYGKSRAFGCGLMLIKPGAEA
>NZ_CP029122.1|WP_000085051.1|1330819_1331566_+|type-I-E-CRISPR-associated-protein-Cas5/CasD
MSQYLIFQLHGPMASWGVDAPGEVRHTHELPSRSALLGLLAAGVGIRRDDTERLNAFNRHYSLVVCASRNPRWARDYHTIQMPKEVRKARYFSRREELSDPDLLSAIISRRDYYTDAWWMVAVATTADAPYSLEQLQDGLRHPVFPLYLGRKSHPLALPLAPLLLEGNACDALCNAYQQYQDHFHKLKVSLPKLQDECWWEGEHDGLVASKILRRRDVPLNRQQWLFGERTINQGPWLSKEEPCTSQE
>NZ_CP029122.1|WP_000956458.1|1327816_1327969_+|type-I-toxin-antitoxin-system-Hok-family-toxin
MLTKYALVAIIVLCCTVLGFTLMVGDSLCELSIRERGMEFKAVLAYESKK
>NZ_CP029122.1|WP_000039842.1|1326817_1327552_+|phosphoadenosine-phosphosulfate-reductase
MSKLDLNALNELPKVDRILALAETNAELEKLDAEGRVAWALDNLPGEYVLSSSFGIQAAVSLHLVNQIHPDIPVILTDTGYLFPETYRFIDELTDKLKLNLKVYRATESAAWQEARYGKLWEQGVEGIEKYNDINKVEPMNRALKELNAQTWFAGLRREQSGSRANLPVLAIQRGVFKVLPIIDWDNRTIYQYLQKHGLKYHPLWDEGYLSVGDTHTTRKWEPGMLEEETRFFGLKRECGLHEG
>NZ_CP029122.1|WP_001290706.1|1325031_1326744_+|assimilatory-sulfite-reductase-(NADPH)-hemoprotein-subunit
MSEKHPGPLVVEGKLTDAERMKLESNYLRGTIAEDLNDGLTGGFKGDNFLLIRFHGMYQQDDRDIRAERAEQKLEPRHAMLLRCRLPGGVITTKQWQAIDKFAGENTIYGSIRLTNRQTFQFHGILKKNVKPVHQMLHSVGLDALATANDMNRNVLCTSNPYESQLHAEAYEWAKKISEHLLPRTRAYAEIWLDQEKVATTDEEPILGQTYLPRKFKTTVVIPPQNDIDLHANDMNFVAIAENGKLVGFNLLVGGGLSIEHGNKKTYARTASEFGYLPLEHTLAVAEAVVTTQRDWGNRTDRKNAKTKYTLERVGVETFKAEVERRAGIKFEPIRPYEFTGRGDRIGWVKGIDDNWHLTLFIENGRILDYPGRPLKTGLLEIAKIHKGDFRITANQNLIIAGVPESEKAKIEKIAKESGLMNAVTPQRENSMACVSFPTCPLAMAEAERFLPSFIDNIDNLMAKHGVSDEHIVMRVTGCPNGCGRAMLAEVGLVGKAPGRYNLHLGGNRIGTRIPRMYKENITEPEILASLDELIGRWAKEREAGEGFGDFTVRAGIIRPVLDPARDLWD
>NZ_CP029122.1|WP_000211954.1|1323232_1325032_+|NADPH-dependent-assimilatory-sulfite-reductase-flavoprotein-subunit
MTTQVPPSALLPLNPEQLVRLQAATTDLTPTQLAWVSGYFWGVLNQQPAALAATPAPAAEMPGITIISASQTGNARRVAEALRDDLLAAKLNVKLVNAGDYKFKQIASEKLLIVVTSTQGEGEPPEEAVALHKFLFSKKAPKLENTAFAVFSLGDSSYEFFCQSGKDFDSKLAELGGERLLDRVDADVEYQAAASEWRARVVDALKSRAPVAAPSQSVATGAVNEIHTSPYSKDAPLVASLSVNQKITGRNSEKDVRHIEIDLGDSGLRYQPGDALGVWYQNDPALVKELVELLWLKGDEPVTVEGKTLPLNEALQWHFELTVNTANIVENYATLTRSETLLPLVGDKAKLQHYAATTPIVDMVRFSPAQLDAEALINLLRPLTPRLYSIASSQAEVENEVHVTVGVVRYDVEGRARAGGASSFLADRVEEEGEVRVFIEHNDNFRLPANPETPVIMIGPGTGIAPFRAFMQQRAADEAPGKNWLFFGNPHFTEDFLYQVEWQRYVKDGVLTRIDLAWSRDQKEKVYVQDKLREQGAELWRWINDGAHIYVCGDANRMAKDVEQALLEVIAEFGGMDTEAADEFLSELRVERRYQRDVY
>NZ_CP029122.1|WP_000987944.1|1322551_1322917_-|6-carboxytetrahydropterin-synthase-QueD
MMSTTLFKDFTFEAAHRLPHVPEGHKCGRLHGHSFMVRLEITGEVDPHTGWIIDFAELKAAFKPTYERLDHHYLNDIPGLENPTSEVLAKWIWDQVKPVVPLLSAVMVKETCTAGCIYRGE
>NZ_CP029122.1|WP_001295150.1|1321202_1322474_-|FAD-dependent-oxidoreductase
MEDDCDIIIIGAGIAGTACALRCARAGLSVLLLERAEIPGSKNLSGGRLYTHALAELLPQFHLTAPLERCITHESLSLLTPDGATTFSSLQPGGESWSVLRARFDPWLVAEAEKEGVECIPGATVDALYEENGRVCGVICGDDILRARYVVLAEGANSVLAERHGLVTRPAGEAMALGIKEVLSLETSAIEERFHLENNEGAALLFSGGICDDLPGGAFLYTNQQTLSLGIVCPLSSLTQSRVPASELLTRFKAHPAVRPLIKNTESLEYGAHLVPEGGLHSMPVQYAGNGWLLVGDALRSCVNTGISVRGMDMALTGAQAAAQTLISACQHREPQNLFPLYHHNVERSLLWDVLQRYQHVPALLQRPGWYRTWPALMQDISRDLWDQGDKPVPPLRQLFWHHLRRHGLWHLAGDVIRSLRCL
>NZ_CP029122.1|WP_000490426.1|1334163_1335201_-|alkaline-phosphatase-isozyme-conversion-aminopeptidase
MFSALRHRTAALALGVCFILPVHASSPKPGDFANTQARHIATFFPGRMTGTPAEMLSADYIRQQFQQMGYRSDIRTFNSRYIYTARDNRKSWHNVTGSTVIAAHEGKAPQQIIIMAHLDTYAPLSDADADANLGGLTLQGMDDNAAGLGVMLELAERLKNTPTEYGIRFVATSGEEEGKLGAENLLKRMSDTEKKNTLLVINLDNLIVGDKLYFNSGVKTPEAVRKLTRDRALAIARSHGIAATTNPGLNKNYPKGTGCCNDAEIFDKAGIAVLSVEATNWNLGNKDGYQQRAKTAAFPAGNSWHDVRLDNQQHIDKALPGRIERRCRDVMRIMLPLVKELAKAS
>NZ_CP029122.1|WP_000372108.1|1335452_1336361_+|sulfate-adenylyltransferase-subunit-CysD
MDQIRLTHLRQLEAESIHIIREVAAEFSNPVMLYSIGKDSSVMLHLARKAFYPGTLPFPLLHVDTGWKFREMYEFRDRTAKAYGCELLVHKNPEGVAMGINPFVHGSAKHTDIMKTEGLKQALNKYGFDAAFGGARRDEEKSRAKERIYSFRDRFHRWDPKNQRPELWHNYNGQINKGESIRVFPLSNWTEQDIWQYIWLENIDIVPLYLAAERPVLERDGMLMMIDDNRIDLQPGEVIKKRMVRFRTLGCWPLTGAVESNAQTLPEIIEEMLVSTTSERQGRVIDRDQAGSMELKKRQGYF
>NZ_CP029122.1|WP_001090386.1|1336362_1337790_+|sulfate-adenylyltransferase-subunit-CysN
MNTALAQQIANEGGVEAWMIAQQHKSLLRFLTCGSVDDGKSTLIGRLLHDTRQIYEDQLSSLHNDSKRHGTQGEKLDLALLVDGLQAEREQGITIDVAYRYFSTEKRKFIIADTPGHEQYTRNMATGASTCELAILLIDARKGVLDQTRRHSFISTLLGIKHLVVAINKMDLVDYSEKTFTRIREDYLTFAGQLPGNLDIRFVPLSALEGDNVASQSESMAWYSGPTLLEVLETVEIQRVVDAQPMRFPVQYVNRPNLDFRGYAGTLASGRVEVGQRVKVLPSGVESNVARIVTFDGDREEAFAGEAITLVLTDEIDISRGDLLLAADEALPAVQSASVDVVWMAEQPLSPGQSYDIKIAGKKTRARVDGIRYQVDINNLTQREVENLPLNGIGLVDLTFDEPLVLDRYQQNPVTGGLIFIDRLSNVTVGAGMVHEPVSQATAAPSEFSAFELELNALVRRHFPHWGARDLLGDK
>NZ_CP029122.1|WP_001173673.1|1337789_1338395_+|adenylyl-sulfate-kinase
MALHDENVVWHSHPVTVQQRELHHGHRGVVLWFTGLSGSGKSTVAGALEEALHKLGVSTYLLDGDNVRHGLCSDLGFSDADRKENIRRVGEVANLMVEAGLVVLTAFISPHRAERQMVRERVGEGRFIEVFVDTPLAICEARDPKGLYKKARAGELRNFTGIDSVYEAPESAEIHLNGEQLVTNLVQQLLDLLRQNDIIRS
>NZ_CP029122.1|WP_001246104.1|1338444_1338768_+|DUF3561-family-protein
MRNSHNITLTNNDSLTEDEETTWSLPGAVVGFISWLFALAMPMLIYGSNTLFFFIYTWPFFLALMPVAVVVGIALHSLMDGKLRYSIVFTLVTVGIMFGALFMWLLG
>NZ_CP029122.1|WP_000517476.1|1338961_1339273_+|cell-division-protein-FtsB
MGKLTLLLLAILVWLQYSLWFGKNGIHDYTRVNDDVAAQQATNAKLKARNDQLFAEIDDLNGGQEALEERARNELSMTRPGETFYRLVPDASKRAQSAGQNNR
>NZ_CP029122.1|WP_000246138.1|1339291_1340002_+|2-C-methyl-D-erythritol-4-phosphate-cytidylyltransferase
MATTHLDVCAVVPAAGFGRRMQTECPKQYLSIGNQTILEHSVHALLAHPRVKRVVIAISPGDSRFAQLPLANHPQITVVDGGDERADSVLAGLKAAGDAQWVLVHDAARPCLHQDDLARLLALSETSRTGGILAAPVRDTMKRAEPGKNAIAHTVDRNGLWHALTPQFFPRELLHDCLTRALNEGATITDEASALEYCGFHPQLVEGRADNIKVTRPEDLALAEFYLTRTIHQENT
>NZ_CP029122.1|WP_001374730.1|1340001_1340481_+|2-C-methyl-D-erythritol-2,4-cyclodiphosphate-synthase
MRIGHGFDVHAFGGEGPIIIGGVRIPYERGLLAHSDGDVALHALTDALLGAAALGDIGKLFPDTDPAFKGADSRELLREAWRRIQAKGYTLGNVDVTIIAQAPKMLPHIPQMRVFIAEDLGCHMDDVNVKATTTEKLGFTGRGEGIACEAVALLIKATK
>NZ_CP029122.1|WP_000568943.1|1340477_1341527_+|tRNA-pseudouridine(13)-synthase-TruD
MIEFDNLTYLHGKPQGTGLLKANPEDFVVVEDLGFEPDGEGEHILVRILKNGCNTRFVADALAKFLKIHAREVSFAGQKDKHAVTEQWLCARVPGKEMPDLSAFQLEGCQVLEYARHKRKLRLGALKGNAFTLVLREVSNRDDVEQRLIDICVKGVPNYFGAQRFGIGGSNLQGAQRWAQTNTPVRDRNKRSFWLSAARSALFNQIVAERLKKADVNQVVDGDALQLAGRGSWFVATTEELAELQRRVNDKELMITAALPGSGEWGTQREALAFEQAAVAAETELQALLVREKVEAARRAMLLYPQQLSWNWWDDVTVEIRFWLPAGSFATSVVRELINTTGDYAHIAE
>NZ_CP029122.1|WP_001374723.1|1341507_1342269_+|5'/3'-nucleotidase-SurE
MRILLSNDDGVHAPGIQTLAKALREFADVQVVAPDRNRSGASNSLTLESSLRTFTFENGDIAVQMGTPTDCVYLGVNALMRPRPDIVVSGINAGPNLGDDVIYSGTVAAAMEGRHLGFPALAVSLDGHKHYDTAAAVICSILRALCKEPLRTGRILNINVPDLPLDQIKGIRVTRCGTRHPADQVIPQQDPRGNTLYWIGPPGGKCDAGPGTDFAAVDEGYVSITPLHVDLTAHSAQDVVSDWLNSVGVGTQW

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP029122_5

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP029122_5

1836729-1836846

Orphan

Consensus_repeat	Method
CCGAGCCGTAGGCCGGATAAGGCGTTCACGC	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_CP029122_5

>merge|NZ_CP029122|5|1836729-1836846|CRISPRCasFinder
CCGAGCCGTAGGCCGGATAAGGCGTTCACGCTGCATCCGGCACCCGGAGCCTGATGCGACGCTGGCGCGTCTTATCAGGCCTACAAACCGAGCCGTAGGCCGGATAAGGCGTTTACGC

>NZ_CP029122|5|5|1836729-1836846|CRISPRCasFinder
CCGAGCCGTAGGCCGGATAAGGCGTTCACGC	TGCATCCGGCACCCGGAGCCTGATGCGACGCTGGCGCGTCTTATCAGGCCTACAAA
CCGAGCCGTAGGCCGGATAAGGCGTTTACGC

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP029122.1\|WP_000012305.1\|1847371_1849060_+\|DUF2138-domain-containing-protein	unknown	unknown	gnl\|CDD\|227030
NZ_CP029122.1\|WP_001209908.1\|1826001_1827261_-\|glycerol-3-phosphate-dehydrogenase-subunit-GlpB	unknown	unknown	gnl\|CDD\|225617
NZ_CP029122.1\|WP_001567753.1\|1855872_1856649_+\|YfaP-family-protein	unknown	unknown	gnl\|CDD\|227021
NZ_CP029122.1\|WP_072163405.1\|1831809_1832124_-\|hypothetical-protein	unknown	unknown	unknown
NZ_CP029122.1\|WP_000768974.1\|1830514_1831591_+\|glycerophosphodiester-phosphodiesterase	unknown	unknown	gnl\|CDD\|236859
NZ_CP029122.1\|WP_001000370.1\|1824814_1826005_-\|anaerobic-glycerol-3-phosphate-dehydrogenase-subunit-C	unknown	unknown	gnl\|CDD\|132422
NZ_CP029122.1\|WP_001295211.1\|1849056_1849680_+\|DUF1175-domain-containing-protein	unknown	unknown	gnl\|CDD\|225774
NZ_CP029122.1\|WP_122633159.1\|1849823_1854218_+\|alpha-2-macroglobulin-family-protein	unknown	unknown	gnl\|CDD\|225248
NZ_CP029122.1\|WP_000990756.1\|1843726_1844449_-\|bifunctional-2-polyprenyl-6-hydroxyphenol-methylase/3-demethylubiquinol-3-O-methyltransferase-UbiG	unknown	unknown	gnl\|CDD\|235350
NZ_CP029122.1\|WP_000332037.1\|1835501_1836632_-\|ribonucleotide-diphosphate-reductase-subunit-beta	unknown	unknown	gnl\|CDD\|181647
NZ_CP029122.1\|WP_000301049.1\|1834543_1835194_+\|lipopolysaccharide-kinase-InaA	unknown	unknown	gnl\|CDD\|182136
NZ_CP029122.1\|WP_001220074.1\|1839846_1843599_+\|AIDA-I-family-autotransporter-adhesin-YfaL/EhaC	unknown	unknown	gnl\|CDD\|182059
NZ_CP029122.1\|WP_001075164.1\|1836865_1839151_-\|ribonucleoside-diphosphate-reductase-subunit-alpha	unknown	unknown	gnl\|CDD\|181649
NZ_CP029122.1\|WP_001374259.1\|1823722_1824622_-\|ISNCY-family-transposase	unknown	unknown	gnl\|CDD\|182167
NZ_CP029122.1\|WP_000786548.1\|1856722_1857907_-\|acetyl-CoA-acetyltransferase	unknown	unknown	gnl\|CDD\|180261
NZ_CP029122.1\|WP_000948732.1\|1829151_1830510_+\|glycerol-3-phosphate-transporter	unknown	unknown	gnl\|CDD\|236889
NZ_CP029122.1\|WP_000857251.1\|1827250_1828879_-\|anaerobic-glycerol-3-phosphate-dehydrogenase-subunit-A	unknown	unknown	gnl\|CDD\|236847
NZ_CP029122.1\|WP_001104488.1\|1854218_1855868_+\|DUF2300-domain-containing-protein	unknown	unknown	gnl\|CDD\|227732
NZ_CP029122.1\|WP_000135040.1\|1835247_1835502_-\|ferredoxin-like-diferric-tyrosyl-radical-cofactor-maintenance-protein-YfaE	unknown	unknown	gnl\|CDD\|182668
NZ_CP029122.1\|WP_001281225.1\|1844595_1847223_+\|DNA-topoisomerase-(ATP-hydrolyzing)-subunit-A	unknown	unknown	gnl\|CDD\|235502

Protein	Function_ID	Function_description	E-value
NZ_CP029122.1\|WP_000012305.1\|1847371_1849060_+\|DUF2138-domain-containing-protein	gnl\|CDD\|227030	COG4685, COG4685, Uncharacterized protein conserved in bacteria [Function unknown].	0
NZ_CP029122.1\|WP_001209908.1\|1826001_1827261_-\|glycerol-3-phosphate-dehydrogenase-subunit-GlpB	gnl\|CDD\|225617	COG3075, GlpB, Anaerobic glycerol-3-phosphate dehydrogenase [Amino acid transport and metabolism].	0
NZ_CP029122.1\|WP_001567753.1\|1855872_1856649_+\|YfaP-family-protein	gnl\|CDD\|227021	COG4676, COG4676, Uncharacterized protein conserved in bacteria [Function unknown].	1.0163e-152
NZ_CP029122.1\|WP_000948732.1\|1829151_1830510_+\|glycerol-3-phosphate-transporter	gnl\|CDD\|236889	PRK11273, glpT, glycerol-3-phosphate transporter.	0
NZ_CP029122.1\|WP_000768974.1\|1830514_1831591_+\|glycerophosphodiester-phosphodiesterase	gnl\|CDD\|236859	PRK11143, glpQ, glycerophosphodiester phosphodiesterase; Provisional.	0
NZ_CP029122.1\|WP_001000370.1\|1824814_1826005_-\|anaerobic-glycerol-3-phosphate-dehydrogenase-subunit-C	gnl\|CDD\|132422	TIGR03379, glycerol3P_GlpC, glycerol-3-phosphate dehydrogenase, anaerobic, C subunit. Members of this protein family are the membrane-anchoring, non-catalytic C subunit, product of the glpC gene, of a three-subunit, FAD-dependent, anaerobic glycerol-3-phosphate dehydrogenase. GlpC lasks classical hydrophobic transmembrane helices; Cole, et al suggest interaction with the membrane may involve amphipathic helices. GlcC has conserved Cys-containing motifs suggestive of iron-sulfur binding. This complex is found mostly in Escherichia coli and closely related species. [Energy metabolism, Anaerobic].	0
NZ_CP029122.1\|WP_001295211.1\|1849056_1849680_+\|DUF1175-domain-containing-protein	gnl\|CDD\|225774	COG3234, COG3234, Uncharacterized protein conserved in bacteria [Function unknown].	7.99004e-141
NZ_CP029122.1\|WP_000990756.1\|1843726_1844449_-\|bifunctional-2-polyprenyl-6-hydroxyphenol-methylase/3-demethylubiquinol-3-O-methyltransferase-UbiG	gnl\|CDD\|235350	PRK05134, PRK05134, bifunctional 2-polyprenyl-6-hydroxyphenol methylase/3-demethylubiquinol 3-O-methyltransferase UbiG.	9.80223e-171
NZ_CP029122.1\|WP_000332037.1\|1835501_1836632_-\|ribonucleotide-diphosphate-reductase-subunit-beta	gnl\|CDD\|181647	PRK09101, nrdB, ribonucleotide-diphosphate reductase subunit beta; Reviewed.	0
NZ_CP029122.1\|WP_000301049.1\|1834543_1835194_+\|lipopolysaccharide-kinase-InaA	gnl\|CDD\|182136	PRK09902, PRK09902, lipopolysaccharide kinase InaA.	1.43283e-158
NZ_CP029122.1\|WP_001220074.1\|1839846_1843599_+\|AIDA-I-family-autotransporter-adhesin-YfaL/EhaC	gnl\|CDD\|182059	PRK09752, PRK09752, AIDA-I family autotransporter YfaL.	0
NZ_CP029122.1\|WP_001075164.1\|1836865_1839151_-\|ribonucleoside-diphosphate-reductase-subunit-alpha	gnl\|CDD\|181649	PRK09103, PRK09103, ribonucleoside-diphosphate reductase subunit alpha.	0
NZ_CP029122.1\|WP_001374259.1\|1823722_1824622_-\|ISNCY-family-transposase	gnl\|CDD\|182167	PRK09956, PRK09956, ISNCY family transposase.	0
NZ_CP029122.1\|WP_000786548.1\|1856722_1857907_-\|acetyl-CoA-acetyltransferase	gnl\|CDD\|180261	PRK05790, PRK05790, putative acyltransferase; Provisional.	0
NZ_CP029122.1\|WP_122633159.1\|1849823_1854218_+\|alpha-2-macroglobulin-family-protein	gnl\|CDD\|225248	COG2373, COG2373, Large extracellular alpha-helical protein [General function prediction only].	0
NZ_CP029122.1\|WP_000857251.1\|1827250_1828879_-\|anaerobic-glycerol-3-phosphate-dehydrogenase-subunit-A	gnl\|CDD\|236847	PRK11101, glpA, anaerobic glycerol-3-phosphate dehydrogenase subunit A.	0
NZ_CP029122.1\|WP_001104488.1\|1854218_1855868_+\|DUF2300-domain-containing-protein	gnl\|CDD\|227732	COG5445, COG5445, Predicted secreted protein [Function unknown].	2.06112e-125
NZ_CP029122.1\|WP_000135040.1\|1835247_1835502_-\|ferredoxin-like-diferric-tyrosyl-radical-cofactor-maintenance-protein-YfaE	gnl\|CDD\|182668	PRK10713, PRK10713, 2Fe-2S ferredoxin-like protein.	2.72138e-53
NZ_CP029122.1\|WP_001281225.1\|1844595_1847223_+\|DNA-topoisomerase-(ATP-hydrolyzing)-subunit-A	gnl\|CDD\|235502	PRK05560, PRK05560, DNA gyrase subunit A; Validated.	0

>NZ_CP029122.1|WP_000332037.1|1835501_1836632_-|ribonucleotide-diphosphate-reductase-subunit-beta
MAYTTFSQTKNDQLKEPMFFGQPVNVARYDQQKYDIFEKLIEKQLSFFWRPEEVDVSRDRIDYQALPEHEKHIFISNLKYQTLLDSIQGRSPNVALLPLISIPELETWVETWAFSETIHSRSYTHIIRNIVNDPSVVFDDIVTNEQIQKRAEGISSYYDELIEMTSYWHLLGEGTHTVNGKTVTVSLRELKKKLYLCLMSVNALEAIRFYVSFACSFAFAERELMEGNAKIIRLIARDEALHLTGTQHMLNLLRSGADDPEMAEIAEECKQECYDLFVQAAQQEKDWADYLFRDGSMIGLNKDILCQYVEYITNIRMQAVGLDLPFQTRSNPIPWINTWLVSDNVQVAPQEVEVSSYLVGQIDSEVDTDDLSNFQL
>NZ_CP029122.1|WP_000135040.1|1835247_1835502_-|ferredoxin-like-diferric-tyrosyl-radical-cofactor-maintenance-protein-YfaE
MARVTLRITGTQLLCQDEHPSLLAALESHNVAVEYQCREGYCGSCRTRLVAGQVDWIAEPLAFIQPGEILPCCCRAKGDIEIEM
>NZ_CP029122.1|WP_000301049.1|1834543_1835194_+|lipopolysaccharide-kinase-InaA
MAVSAKYDEFNHWWATEGDWVEEPNYRRNGMSGVQCVERNGKKLYVKRMTHHLFHSVRYPFGRPTIVREVAVIKELERAGVIVPKIVFGEAVKIEGEWRALLVTEDMAGFISIADWYAQHAVSPYSDEVRQAMLKAVALAFKKMHSINRQHGCCYVRHIYVKTEGKAEAGFLDLEKSRRRLRRDKAINHDFRQLEKYLEPIPKADWEQVKAYYYAM
>NZ_CP029122.1|WP_072163405.1|1831809_1832124_-|hypothetical-protein
MTNKLGGELIDIADKKLAPLINDSFSYTRDFFAYSKQENNIFTFDNSKFVDPKEKEGLMIQHSNGQLVITGKYCPEGVQTAFTQEQYDKLIRYINIFFTFPKCE
>NZ_CP029122.1|WP_000768974.1|1830514_1831591_+|glycerophosphodiester-phosphodiesterase
MKLKLKNLSMAIMMSTIVMGSSAMAADSNEKIVIAHRGASGYLPEHTLPAKAMAYAQGADYLEQDLVMTKDDHLVVLHDHYLDRVTDVADRFPDRARKDGRYYAIDFTLDEIKSLKFTEGFDIENGKKVQTYPGRFPMGKSDFRVHTFEEEIEFVQGLNHSTGKNIGIYPEIKAPWFHHQEGKDIAAKTLEVLKKYGYTGKDDKVYLQCFDADELKRIKNELEPKMGMDLNLVQLIAYTDWNETQQKQPDGSWVNYSYDWMFKPGAMKQVAEYADGIGPDYHMLIEETSQPGNIKLTGMVQDAQQNKLVVHPYTVRSDKLPEYTTDVNQLYDVLYNKAGVNGLFTDFPDKAVKFLNKE
>NZ_CP029122.1|WP_000948732.1|1829151_1830510_+|glycerol-3-phosphate-transporter
MLSIFKPAPHKARLPAAEIDPTYRRLRWQIFLGIFFGYAAYYLVRKNFALAMPYLVEQGFSRGDLGFALSGISIAYGFSKFIMGSVSDRSNPRVFLPAGLILAAAVMLFMGFVPWATSSIAVMFVLLFLCGWFQGMGWPPCGRTMVHWWSQKERGGIVSVWNCAHNVGGGIPPLLFLLGMAWFNDWHAALYMPAFCAILVALFAFAMMRDTPQSCGLPPIEEYKNDYPDDYNEKAEQELTAKQIFMQYVLPNKLLWYIAIANVFVYLLRYGILDWSPTYLKEVKHFALDKSSWAYFLYEYAGIPGTLLCGWMSDKVFRGNRGATGVFFMTLVTIATIVYWMNPAGNPTVDMICMIVIGFLIYGPVMLIGLHALELAPKKAAGTAAGFTGLFGYLGGSVAASAIVGYTVDFFGWDGGFMVMIGGSILAVILLIVVMIGEKRRHEQLLQKRNGG
>NZ_CP029122.1|WP_000857251.1|1827250_1828879_-|anaerobic-glycerol-3-phosphate-dehydrogenase-subunit-A
MKTRDSQSSDVIIIGGGATGAGIARDCALRGLRVILVERHDIATGATGRNHGLLHSGARYAVTDAESARECISENQILKRIARHCVEPTNGLFITLPEDDLSFQATFIRACEEAGISAEAIDPQQARIIEPAVNPALIGAVKVPDGTVDPFRLTAANMLDAKEHGAVILTAHEVTGLIREGATVCGVRVRNHLTGETQALHAPVVVNAAGIWGQHIAEYADLRIRMFPAKGSLLIMDHRINQHVINRCRKPSDADILVPGDTISLIGTTSLRIDYNEIDDNRVTAEEVDILLREGEKLAPVMAKTRILRAYSGVRPLVASDDDPSGRNVSRGIVLLDHAERDGLDGFITITGGKLMTYRLMAEWATDAVCRKLGNTRPCTTADLALPGSQDPAEVTLRKVISLPAPLRGSAVYRHGDRTPAWLSEGRLHRSLVCECEAVTAGEVQYAVENLNVNSLLDLRRRTRVGMGTCQGELCACRAAGLLQRFNVTTSAQSIEQLSTFLNERWKGVQPIAWGDALRESEFTRWVYQGLCGLEKEQKDAL
>NZ_CP029122.1|WP_001209908.1|1826001_1827261_-|glycerol-3-phosphate-dehydrogenase-subunit-GlpB
MRFDTVIMGGGLAGLLCGLQLQKHGLRCAIVTRGQSALHFSSGSLDLLSHLPDGQPVADIHSGLESLRQQAPAHPYSLLGPQRVLDLACQAQALIAESGAQLQGSVELAHQRITPLGTLRSTWLSSPEVPVWPLPAKKICVVGISGLMDFQAHLAAASLRELDLSVETAEIELPELDVLRNNATEFRAVNIARFLDNEENWPLLLDALIPVANTCEMILMPACFGLADDKLWRWLNEKLPCSLMLLPTLPPSVLGIRLQNQLQRQFVRQGGVWMPGDEVKKVTCKNGVVNEIWTRNHADIPLRPRFAVLASGSFFSGGLVAERNGIREPILGLDVLQTATRGEWYKGDFFAPQPWQQFGVTTDETLRPSQAGQTIENLFAIGSVLGGFDPIAQGCGGGVCAVSALHAAQQIAQRAGGQQ
>NZ_CP029122.1|WP_001000370.1|1824814_1826005_-|anaerobic-glycerol-3-phosphate-dehydrogenase-subunit-C
MNDTSFENCIKCTVCTTACPVSRVNPGYPGPKQAGPDGERLRLKDGALYDEALKYCINCKRCEVACPSDVKIGDIIQRARAKYDTTRPSLRNFVLSHTDLMGSVSTPFAPIVNTATSLKPVRQLLDAALKIDHRRTLPKYSFGTFRRWYRSVAAQQAQYKDQVAFFHGCFVNYNHPQLGKDLIKVLNAMGTGVQLLSKEKCCGVPLIANGFTAKARKQAITNVESIREAVGVKGIPVIATSSTCTFALRDEYPEVLNVDNKGLRDHIELATRWLWRKLDEGKTLPLKPLPLKVVYHTPCHMEKMGWTLYTLELLRKIPGLELTVLDSQCCGIAGTYGFKKENYPTSQAIGAPLFRQIEESGADLVVTDCETCKWQIEMSTSLRCEHPITLLAQALA
>NZ_CP029122.1|WP_001374259.1|1823722_1824622_-|ISNCY-family-transposase
MTESTTSSPHDAVFKTFMFTPETARDFLEIHLPEPLRKLCNLQTLRLEPTSFIEKSLRAYYSDVLWSVETSDGDGYIYCVIEHQSSAEKNMAFRLMRYATAAMQRHLDKGYDRVPLVVPLLFYHGETSPYPYSLNWLDEFDDPQLARQLYTEAFPLVDITIVPDDEIMQHRRIALLELIQKHIRDRDLIGMVDRITTLLVKGFTNDSQLQTLFNYLLQCGDTSRFTRFIEEIAKRSPLQKERLMTIAERLRQEGHQIGWQEGMHEQAIKIALRMLEQGFEREIVLATTQLTDADIPNCH
>NZ_CP029122.1|WP_001075164.1|1836865_1839151_-|ribonucleoside-diphosphate-reductase-subunit-alpha
MNQNLLVTKRDGSTERINLDKIHRVLDWAAEGLHNVSISQVELRSHIQFYDGIKTSDIHETIIKAAADLISRDAPDYQYLAARLAIFHLRKKAYGQFEPPALYDHVVKMVEMGKYDNHLLEDYTEEEFKQMDTFIDHDRDMTFSYAAVKQLEGKYLVQNRVTGEIYESAQFLYILVAACLFSNYPRETRLQYVKRFYDAVSTFKISLPTPIMSGVRTPTRQFSSCVLIECGDSLDSINATSSAIVKYVSQRAGIGINAGRIRALGSPIRGGEAFHTGCIPFYKHFQTAVKSCSQGGVRGGAATLFYPMWHLEVESLLVLKNNRGVEGNRVRHMDYGVQINKLMYTRLLKGEDITLFSPSDVPGLYDAFFADQEEFERLYTKYEKDDSIRKQRVKAVELFSLMMQERASTGRIYIQNVDHCNTHSPFDPAIAPVRQSNLCLEIALPTKPLNDVNDENGEIALCTLSAFNLGAINNLDELEELAILAVRALDALLDYQDYPIPAAKRGAMGRRTLGIGVINFAYYLAKHGKRYSDGSANNLTHKTFEAIQYYLLKASNELAKEQGACPWFNETTYAKGILPIDTYKKDLDTIANEPLHYDWEALRESIKTHGLRNSTLSALMPSETSSQISNATNGIEPPRGYVSIKASKDGILRQVVPDYEHLHDAYELLWEMPGNDGYLQLVGIMQKFIDQSISANTNYDPSRFPSGKVPMQQLLKDLLTAYKFGVKTLYYQNTRDGAEDAQDDLVPSIQDDGCESGACKI
>NZ_CP029122.1|WP_001220074.1|1839846_1843599_+|AIDA-I-family-autotransporter-adhesin-YfaL/EhaC
MRIIFLRKEYLSLLPSMIASLFSANGVAAVTDSCQGYDVKASCQASRQSLSGITQDWSIADGQWLVFSDMTNNASGGAVFLQQGAEFSLLPENETGMTLFANNTVTGEYNNGGAIFAKENSTLNLTDVIFSGNVAGGYGGAIYSSGTNDTGAVDLRVTNAMFRNNIANDGKGGAIYTINNDVYLSDVIFDNNQAYTSTSYSDGDGGAIDVTDNNSDSKHPSGYTIVNNTAFTNNTAEGYGGAIYTNSVTAPYLIDISVDDSYSQNGGVLVDENNSAAGYGDGPSSAAGGFMYLGLSEVTFDIADGKTLVIGNTENDGAVDSIAGTGLITKTGSGDLVLNADNNDFTGEMQIENGEVTLGRSNSLMNVGDTHCQDDPQDCYGLTIGSIDQYQNQAELNVGSTQQTFVHALTGFQNGTLNIDAGGNVTVNQGSFAGIIEGAGQLTIAQNGSYVLAGAQSMALTGDIVVDDGAVLSLEGDAADLTALQDDPQSIVLNGGVLDLSDFSTWQSGTSYNDGLEVSGSSGTVIGSQDVVDLAGGDNLHIGGDGKDGVYVVVDASDGQVSLANNNSYLGTTQIASGTLMVSDNSQLGDTHYNRQVIFTDKQQESVMEITSDVDTRSDAAGHGRDIEMRADGEVAVDAGVDTQWGALMADSSGQHQDEGSTLTKTGAGTLELTASGTTQSAVRVEEGTLKGDVADILPYASSLWVGDGATFVTGADQDIQSIDAISSGTIDISDGTVLRLTGQDTSVALNASLFNGDGTLVNATDGVTLTGELNTNLETDSLTYLSNVTVNGNLTNTSGAVSLQNGVAGDTLTVNGDYTGGGTLLLDSELNGDDSVSDQLVMNGNTAGNTTVVVNSITGIGEPTSTGIKMVDFAADPTQFQNNAQFSLAGSGYVNMGAYDYTLVEDNNDWYLRSQEVTPPSPPDPDPTPDPDPTPDPDPTPDPEPTPAYQPVLNAKVGGYLNNLRAANQAFMMERRDHAGGDGQTLNLRVIGGDYHYTAAGQLAQHEDTSTVQLSGDLFSGRWGTDGEWMLGIVGGYSDNQGDSRSNMTGTRADNQNHGYAVGLTSSWFQHGNQKQGAWLDSWLQYAWFSNDVSEQEDGTDHYHSSGIIASLEAGYQWLPGRGVVIEPQAQVIYQGVQQDDFTAANRARVSQSQGDDIQTRLGLHSEWRTAVHVIPTLDLNYYHDPHSTEIEEDGSTISDDAVKQRGEIKVGVTGNISQRVSLRGSVAWQKGSDDFAQTAGFLSMTVKW
>NZ_CP029122.1|WP_000990756.1|1843726_1844449_-|bifunctional-2-polyprenyl-6-hydroxyphenol-methylase/3-demethylubiquinol-3-O-methyltransferase-UbiG
MNAEKSPENHNVDHEEIAKFEAVASRWWDLEGEFKPLHRINPLRLGYIAERAGGLFGKKVLDVGCGGGILAESMAREGATVTGLDMGFEPLQVAKLHALESGIQVDYVQETVEKHAAKHAGQYDVVTCMEMLEHVPDPQSVVRACAQLVKPGGDVFFSTLNRNGKSWLMAVVGAEYILRMVPKGTHDVKKFIKPAELLGWVDQTSLKERHITGLHYNPITNSFKLGPGVDVNYMLHTQNK
>NZ_CP029122.1|WP_001281225.1|1844595_1847223_+|DNA-topoisomerase-(ATP-hydrolyzing)-subunit-A
MSDLAREITPVNIEEELKSSYLDYAMSVIVGRALPDVRDGLKPVHRRVLYAMNVLGNDWNKAYKKSARVVGDVIGKYHPHGDLAVYNTIVRMAQPFSLRYMLVDGQGNFGSIDGDSAAAMRYTEIRLAKIAHELMADLEKETVDFVDNYDGTEKIPDVMPTKIPNLLVNGSSGIAVGMATNIPPHNLTEVINGCLAYIDDEDISIEGLMEHIPGPDFPTAAIINGRRGIEEAYRTGRGKVYIRARAEVEVDAKTGRETIIVHEIPYQVNKARLIEKIAELVKEKRVEGISALRDESDKDGMRIVIEVKRDAVGEVVLNNLYSQTQLQVSFGINMVALHHGQPKIMNLKDIIAAFVRHRREVVTRRTIFELRKARDRAHILEALAVALANIDPIIELIRHAPTPAEAKTALVANPWQLGNVAAMLERAGDDAARPEWLEPEFGVRDGLYYLTEQQAQAILDLRLQKLTGLEHEKLLDEYKELLDQIAELLRILGSADRLMEVIREELELVREQFGDKRRTEITANSADINLEDLITQEDVVVTLSHQGYVKYQPLSEYEAQRRGGKGKSAARIKEEDFIDRLLVANTHDHILCFSSRGRVYSMKVYQLPEATRGARGRPIVNLLPLEQDERITAILPVTEFEEGVKVFMATANGTVKKTVLTEFNRLRTAGKVAIKLVDGDELIGVDLTSGEDEVMLFSAEGKVVRFKESSVRAMGCNTTGVRGIRLGEGDKVVSLIVPRGDGAILTATQNGYGKRTAVAEYPTKSRATKGVISIKVTERNGLVVGAVQVDDCDQIMMITDAGTLVRTRVSEISIVGRNTQGVILIRTAEDENVVGLQRVAEPVDEEDLDTIDGSAAEGDDEIAPEVDVDDEPEEE
>NZ_CP029122.1|WP_000012305.1|1847371_1849060_+|DUF2138-domain-containing-protein
MSGEKKAKGWRFYGLVGFGAIALLSAGVWALQYAGSGPEKTLSPLVVHNNLQIDLNEPDLFLDSDSLSQLPKDLLTIPFLHDVLSEDFVFYYQNHADRLGIEGSIRRIVYEHDLTLKDKLFSSLLDQPAQAALWHDKQGHLSHYMVLIQRSGLSKLLEPLLFAATSDSQLSKTEISSIKINSETVPVYQLRYNGNNALMFATYQDKMLVFSSTDMLFKDDQQDTEATAIAGDLLSGKKRWQASFGLEERTAEKTPVRQRIVVSARWLGFGYQRLMPSFAGVRFEMGNDGWHSFVALNDESASVDASFDFTPVWNSMPAGASFCVAVPYSHGIAEEMLSHISQENDKLNGALDGAAGLCWYEDSKLQTPLFVGQFDGTAEQAQLPGKLFTQNIGAHESKAPEGVLPVSQTQQGEAQIWRREVSSRYGQYPKAQAAQPDQLMSDYFFRVSLAMQNKTLLFSLDDTLVNNALQTLNKTRPAMVDVIPTDGIVPLYINPQGIAKLLRNETLTSLPKNLEPVFYNAAQTLLMPKLDALSQQPRYVMKLAQMEPGAAWQWLPITWQPL
>NZ_CP029122.1|WP_001295211.1|1849056_1849680_+|DUF1175-domain-containing-protein
MRHGLLALICWLCCVVAHSEMLNVEQSGLFRAWFVRIAQEQLRQGPSPRWYQQDCAGLVRFAANETLKVHDSKWLKSNGLSSQYLPPEMTLTPEQRQLAQNWNQGNGKTGPYVTAINLIQYNSQFIGQDINQALPGDMIFFDQGDAQHLMVWMGRYVIYHTGSATKTDNGMRAVSLQQLMTWKDTRWIPNDSNPNFIGIYRLNFLAR
>NZ_CP029122.1|WP_122633159.1|1849823_1854218_+|alpha-2-macroglobulin-family-protein
MRLEAPGRDYRRYQMEEYGGVDVRLYRIPDPMAFLRQQKNLHRIVVQPQYLGDGLNNTLTWLWDNWYGKSRRVMQRTFSSQSRQNVTQALPELQLGNAIIKPSRYVQNNQFSPLKKYPLVEQFRYPLWQAKPFEPQQGVKLEGASSNFISPQPGNIYIPLGQQEPGLYLVEAMVGGYRATTVVFVSDTVALSKVSGNELLVWTAGKKQGEAKPGSEILWTDGLGVMTRGVTDDSGTLQLQHISPERSYILGKDAEGGVFVSENFFYESEIYNTRLYIFTDRPLYRAGDRVDVKVMGREFHDPLHSSPIVSAPAKLSVLDANGSLLQTVDVTLDARNGGQGSFRLPENAVAGGYELRLAYRNQVYSSSFRVANYIKPHFEIGLALAKKEFKTGEAVSGKLQLLYPDGEPVKNARVQLSLRAQQLSMVGNDLRYAGRFPVSLEGSETVSDASGHVALNLPAADKPSRYLLTVSASDGAAYRVTTTKEILIERGLAHYSLSTAAQYSNSGESVVFRYAALESSKQVPVTYEWLRLEDRTSHSGELPSGGKSFTVNFAKPGNYNLTLRDKDGLILAGLSHAVSGKGSTAHTGTVDIVADKTLYQPGETAKMLITFPEPIDEALLTLERDRVEQQSLLSHPANWLTLQRLNDTQYEARVPVSNSFAPNITFSVLYTRNGQYSFQNAGIKVAVPQLDIRVKTDKTHYQPGELVNVELTSSLKGKPVSAQLTVGVVDEMIYALQPEIAPNIGKFFYPLGRNNVRTSSSLSFISYDQALSSEPVAPGATNRSERRVKMLERPRREEVDTAAWMPSLTTDKQGKAYFTFLMPDSLTRWRITARGMNGDGLVGQGRAYLRSEKNLYMKWSMPTVYRVGDKPAAGLFIFSQQDNEPVALVTKFAGAEMRQTLTLHKGANYISLTQNIQQSGLLSAELQQNGQVQDSISTKLSFVDNSWPVEQQKNVMLGGGDNALMLPEQASNIRLQSSETPQEIFRNNLDALVDEPWGGVINTGSRLIPLSLAWRSLADHQSAAANDIRQMIQVNRLRLMQLAGPGARFTWWGEDGNGDAFLTAWAWYADWQASQAIGVTQQPEYWQHMLDSYAEQADNMPLLHRALVLAWAQEMNLPCKTLLKGLDEAIARRGTKTEDFSEEDTRDINDSLILDTPESPLADAVANVLTMTLLKKAQLKSTVMPQVQQYAWDKAANSNQPLAHTVVLLNSGGDATQAAAILSGLTAEQSTIERALAMNWLAKYMATMPPVVLPAPAGAWAKHKLTGGGEYWRWVGQGVPDILSFGDELSPQNVQVRWREPAKTAQQSNIPVTVERQLYRLITGEEEMSFTLQPVTSNEIDSDALYLDEITLTSEQDAVLRYGQVEVPLPPGADVERTTWGISVNKPNAAKQQGQLLEIARNEMGELAYMVPVKELTGTVTFRHLLRFSQKGQFVLPPARYMRSYAPAQQSVAAGSEWTRMQVK
>NZ_CP029122.1|WP_001104488.1|1854218_1855868_+|DUF2300-domain-containing-protein
MNWRRIVWLLALVTLPTLAEEPPLQLALRGAQHDQLYKLSSSGVTNVSTLPDTLTTPLGSLWKLYVYAWLEDTHQPEQPYQCRGNSPEEVYCCQAGESITRDTALVRSCGLYFAPQRLHIGADVWGQYWQQRQAPAWLASLTTLKPETSVTVKSLLDSLATLPAQNKAQEVLLDVVLDEAKIGVASMLGSRVRVKTWSWFADDKQEIRQGGFAGWLTDGTPLWVTGSGTSKTVLTRYATVLNRVLPVPTQVASGQCVEVELFARYPLKKITAEKSTTAVKPGVLNGRYRVTFTNGNHITFVSHGETTLLSEKGKLKLQSHLDREEYVARVLDREAKSTPPEAAKAMTVAIRTFLQQNANREGDCLTIPDSSATQRVSASPATTGARTMAAWTQDLIYAGDPVHYHGSRATEGTLSWRQATAQAGQGERYDQILAFAYPDNSLSRWGAPRSTCQLLPKAKAWLAKKMPQWRRILQAETGYNEPDVFAVCRLVSGFPYTDRQQKRLFIRNFFTLQDRLDLTHEYLHLAFDGYPTGLDENYIETLTRQLLMD
>NZ_CP029122.1|WP_001567753.1|1855872_1856649_+|YfaP-family-protein
MRKIFLPLLLVALSPVAHSEGVQEVEIDAPLSGWHPVEGEDASFSQSINYPASSVNMADDQNISAQIRGKIKNYAAAGKVQQGRLVVNGASMPQRIESDGSFARPYIFTEGSNSVQVISPDGQSRQKMQFYSTPGTGTIRARLRLVLSWDTDNTDLDLHVVTPDGEHAWYGNTVLKNSGALDMDVTTGYGPEIFAMPAPVHGRYQVYINYYGGRSETELTTAQLTLITDEGSVNEKQETFIVPMRNAGELTLVKSFDW
>NZ_CP029122.1|WP_000786548.1|1856722_1857907_-|acetyl-CoA-acetyltransferase
MKNCVIVSAVRTAIGSFNGSLASTSAIDLGATVIKAAIERAKIDSQHVDEVIMGNVLQAGLGQNPARQALLKSGLAETVCGFTVNKVCGSGLKSVALAAQAIQAGQAQSIVAGGMENMSLAPYLLDAKARSGYRLGDGQVYDVILRDGLMCATHGYHMGITAENVAKEYGITREMQDELALHSQRKAAAAIESGAFTAEIVPVNVVTRKKTFVFSQDEFPKANSTAEALGALRPAFDKAGTVTAGNASGINDGAAALVIMEESAALAAGLTPLARIKSYASGGVPPALMGMGPVPATQKALQLAGLQLADIDLIEANEAFAAQFLAVGKTLGFDPEKVNVNGGAIALGHPIGASGARILVTLLHAMQARDKTLGLATLCIGGGQGIAMVIERLN

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP029122_6

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP029122_6

2457166-2457289

Orphan

Consensus_repeat	Method
CGACCCCCACCATGTCAAGGTGGTGCTCTAACCAACTGAGCTA	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_CP029122_6

>merge|NZ_CP029122|6|2457166-2457289|CRISPRCasFinder
CGACCCCCACCATGTCAAGGTGGTGCTCTAACCAACTGAGCTACGGACGCAGGATGGTGCGTTCAATTGGACTCGAACCAACGACCCCCACCATGTCAAGGTGGTGCTCTAACCAACTGAGCTA

>NZ_CP029122|6|6|2457166-2457289|CRISPRCasFinder
CGACCCCCACCATGTCAAGGTGGTGCTCTAACCAACTGAGCTA	CGGACGCAGGATGGTGCGTTCAATTGGACTCGAACCAA
CGACCCCCACCATGTCAAGGTGGTGCTCTAACCAACTGAGCTA

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP029122.1\|WP_001182363.1\|2462608_2463820_-\|Bcr/CflA-family-multidrug-efflux-MFS-transporter	unknown	unknown	gnl\|CDD\|182924
NZ_CP029122.1\|WP_001295403.1\|2446620_2448033_-\|pyruvate-kinase-PykF	unknown	unknown	gnl\|CDD\|181699
NZ_CP029122.1\|WP_001373655.1\|2460488_2461130_+\|riboflavin-synthase	unknown	unknown	gnl\|CDD\|183846
NZ_CP029122.1\|WP_001678907.1\|2449900_2452003_+\|aldehyde-ferredoxin-oxidoreductase	unknown	unknown	gnl\|CDD\|236629
NZ_CP029122.1\|WP_000528342.1\|2448588_2448798_+\|fumarate-hydratase-FumD	unknown	unknown	gnl\|CDD\|182359
NZ_CP029122.1\|WP_000587555.1\|2454171_2454984_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|182159
NZ_CP029122.1\|WP_000098911.1\|2461169_2462318_-\|cyclopropane-fatty-acyl-phospholipid-synthase	unknown	unknown	gnl\|CDD\|183282
NZ_CP029122.1\|WP_000190982.1\|2464861_2465887_-\|HTH-type-transcriptional-repressor-PurR	unknown	unknown	gnl\|CDD\|236739
NZ_CP029122.1\|WP_000534291.1\|2457603_2458860_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|137602
NZ_CP029122.1\|WP_000212657.1\|2456725_2457031_-\|monooxygenase	unknown	unknown	gnl\|CDD\|182975
NZ_CP029122.1\|WP_001310861.1\|2452717_2453386_+\|4Fe-4S-dicluster-domain-containing-protein	unknown	unknown	gnl\|CDD\|274451
NZ_CP029122.1\|WP_000102278.1\|2466185_2466275_+\|stress-response-protein-YnhF	unknown	unknown	unknown
NZ_CP029122.1\|WP_001174942.1\|2458900_2460274_-\|multidrug-efflux-MATE-transporter-MdtK	unknown	unknown	gnl\|CDD\|234981
NZ_CP029122.1\|WP_001070230.1\|2449253_2449880_+\|ferredoxin-like-protein	unknown	unknown	gnl\|CDD\|182135
NZ_CP029122.1\|WP_001069997.1\|2453382_2454168_+\|thiosulfate-reductase-cytochrome-B-subunit	unknown	unknown	gnl\|CDD\|184968
NZ_CP029122.1\|WP_000701040.1\|2466440_2467610_+\|MFS-transporter	unknown	unknown	gnl\|CDD\|225371
NZ_CP029122.1\|WP_000716929.1\|2454995_2456600_-\|FAD-NAD(P)-binding-protein	unknown	unknown	gnl\|CDD\|182134
NZ_CP029122.1\|WP_001297805.1\|2452015_2452654_+\|YdhW-family-putative-oxidoreductase-system-protein	unknown	unknown	gnl\|CDD\|182160
NZ_CP029122.1\|WP_000007283.1\|2467755_2468337_-\|superoxide-dismutase-[Fe]	unknown	unknown	gnl\|CDD\|182534
NZ_CP029122.1\|WP_000269501.1\|2463932_2464865_+\|LysR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|182948

Protein	Function_ID	Function_description	E-value
NZ_CP029122.1\|WP_001182363.1\|2462608_2463820_-\|Bcr/CflA-family-multidrug-efflux-MFS-transporter	gnl\|CDD\|182924	PRK11043, PRK11043, Bcr/CflA family multidrug efflux MFS transporter.	0
NZ_CP029122.1\|WP_001295403.1\|2446620_2448033_-\|pyruvate-kinase-PykF	gnl\|CDD\|181699	PRK09206, PRK09206, pyruvate kinase PykF.	0
NZ_CP029122.1\|WP_001373655.1\|2460488_2461130_+\|riboflavin-synthase	gnl\|CDD\|183846	PRK13020, PRK13020, riboflavin synthase subunit alpha; Provisional.	2.8868e-122
NZ_CP029122.1\|WP_001678907.1\|2449900_2452003_+\|aldehyde-ferredoxin-oxidoreductase	gnl\|CDD\|236629	PRK09849, PRK09849, putative oxidoreductase; Provisional.	0
NZ_CP029122.1\|WP_000528342.1\|2448588_2448798_+\|fumarate-hydratase-FumD	gnl\|CDD\|182359	PRK10292, PRK10292, fumarate hydratase FumD.	2.11502e-34
NZ_CP029122.1\|WP_000587555.1\|2454171_2454984_+\|hypothetical-protein	gnl\|CDD\|182159	PRK09946, PRK09946, hypothetical protein; Provisional.	9.78241e-175
NZ_CP029122.1\|WP_000098911.1\|2461169_2462318_-\|cyclopropane-fatty-acyl-phospholipid-synthase	gnl\|CDD\|183282	PRK11705, PRK11705, cyclopropane fatty acyl phospholipid synthase.	0
NZ_CP029122.1\|WP_000190982.1\|2464861_2465887_-\|HTH-type-transcriptional-repressor-PurR	gnl\|CDD\|236739	PRK10703, PRK10703, HTH-type transcriptional repressor PurR.	0
NZ_CP029122.1\|WP_000534291.1\|2457603_2458860_+\|hypothetical-protein	gnl\|CDD\|137602	PRK09945, PRK09945, hypothetical protein; Provisional.	0
NZ_CP029122.1\|WP_000212657.1\|2456725_2457031_-\|monooxygenase	gnl\|CDD\|182975	PRK11118, PRK11118, putative monooxygenase; Provisional.	1.12003e-64
NZ_CP029122.1\|WP_001310861.1\|2452717_2453386_+\|4Fe-4S-dicluster-domain-containing-protein	gnl\|CDD\|274451	TIGR03149, cyt_nit_nrfC, cytochrome c nitrite reductase, Fe-S protein. Members of this protein family are the Fe-S protein, NrfC, of a cytochrome c nitrite reductase system for which the pentaheme cytochrome c protein, NrfB (family TIGR03146) is an unambiguous marker. Members of this protein family show similarity to other ferredoxin-like proteins, including a subunit of a polysulfide reductase. [Energy metabolism, Electron transport].	2.09652e-76
NZ_CP029122.1\|WP_001174942.1\|2458900_2460274_-\|multidrug-efflux-MATE-transporter-MdtK	gnl\|CDD\|234981	PRK01766, PRK01766, multidrug efflux protein; Reviewed.	0
NZ_CP029122.1\|WP_001070230.1\|2449253_2449880_+\|ferredoxin-like-protein	gnl\|CDD\|182135	PRK09898, PRK09898, ferredoxin-like protein.	6.99609e-140
NZ_CP029122.1\|WP_001069997.1\|2453382_2454168_+\|thiosulfate-reductase-cytochrome-B-subunit	gnl\|CDD\|184968	PRK15006, PRK15006, thiosulfate reductase cytochrome B subunit; Provisional.	5.33298e-163
NZ_CP029122.1\|WP_000701040.1\|2466440_2467610_+\|MFS-transporter	gnl\|CDD\|225371	COG2814, AraJ, Arabinose efflux permease [Carbohydrate transport and metabolism].	1.92383e-98
NZ_CP029122.1\|WP_000716929.1\|2454995_2456600_-\|FAD-NAD(P)-binding-protein	gnl\|CDD\|182134	PRK09897, PRK09897, FAD-NAD(P)-binding protein.	0
NZ_CP029122.1\|WP_001297805.1\|2452015_2452654_+\|YdhW-family-putative-oxidoreductase-system-protein	gnl\|CDD\|182160	PRK09947, PRK09947, YdhW family putative oxidoreductase system protein.	1.93584e-120
NZ_CP029122.1\|WP_000007283.1\|2467755_2468337_-\|superoxide-dismutase-[Fe]	gnl\|CDD\|182534	PRK10543, PRK10543, superoxide dismutase [Fe].	3.77321e-138
NZ_CP029122.1\|WP_000269501.1\|2463932_2464865_+\|LysR-family-transcriptional-regulator	gnl\|CDD\|182948	PRK11074, PRK11074, putative DNA-binding transcriptional regulator; Provisional.	0

>NZ_CP029122.1|WP_000212657.1|2456725_2457031_-|monooxygenase
MATLLQLHFAFNGPFGDAMAEQLKPLAESINQEPGFLWKVWTESEKNHEAGGIYLFTDEKSALAYLEKHTARLKNLGVEEVVAKVFDVNEPLSQINQAKLA
>NZ_CP029122.1|WP_000716929.1|2454995_2456600_-|FAD-NAD(P)-binding-protein
MKKIAIVGAGPTGIYTLFSLLQQQTPLSISIFEQADEAGVGMPYSDEENSKMMLANIASIEIPPINCTYLEWLQKQEASHLQRYGVKKETLHDRQFLPRILLGEYFRDQFLRLVDQARQQKFAVAVYESCQVTDLQITNAGVMLATNQDLPSETFDLVVIATGHVWPDEEEATRTYFPSPWSGLMEAKVDACNVGIMGTSLSGLDAAMAVAIQHGSFIEDDKQHVVFNRDNASEKLNITLMSRTGILPEADFYCPIPYEPLHIVTDQALNAEIQKGEEGLLDRVFRLIVEEIKFADPDWSQRIALESLNVDSFAQAWFAERKQRDPFDWAEKNLQEVERNKREKHTVPWRYVILRLHEAVQEIVPHLNEHDHKRFSKGLARVFIDNYAAIPSESIRRLLALREAGIIHILALGEDYEMEINESRTVLKTEDNSYSFDVFIDARGQRPLKVKDIPFPGLREQLQKTGDEIPDVGEDYTLQQPEDIRGRVAFGALPWLMHDQPFVQGLTACAEIGEAMARAVVKPASRARRRLSFD
>NZ_CP029122.1|WP_000587555.1|2454171_2454984_+|hypothetical-protein
MIITRADLREWRIGAVMYRWFLRHFPRGGSYADIHHALIEEGYTDWAESLVEYAWKKWLADENFAHQEVSSMQKLATDPGEIPFCSQFARSDDHARIGCCEDNARIATAGYAAQIASMGYSVRIGSVGFNSHIGSSGERARVAVTGNSSRISSAGDSSRIANTGMRVRVCTLGERCHVASNGDLAQIASFGANARIANSGDNVHIIASGENSTVVSTGVVDSIILGPGGSAALAYHDGERVRFAVAIEGENNIRAGVRYRLNEQHQFVEC
>NZ_CP029122.1|WP_001069997.1|2453382_2454168_+|thiosulfate-reductase-cytochrome-B-subunit
MNPSQHAEQFQSQLANYVPQFTPEFWPVWLIIAGVLLVGMWLVLGLHALLRARGVKKSVTDYGEKIYLYCKAVRLWHWSNALLFVLLLASGLINHFALVGATAVKSLVAVHEVCGFLLLACWLGFVLINAVGGNGHHYRIRRQGWLERAAKQTRFYLFGIMQGEEHPFPATTQSKFNPLQQVAYVGVMYGLLPLLLLTGLLCLYPQAVGDVFPGVRYWLLQAHFALAFISLFFIFGHLYLCTTGRTPHETFKSMVDGYHRH
>NZ_CP029122.1|WP_001310861.1|2452717_2453386_+|4Fe-4S-dicluster-domain-containing-protein
MSFTRRKFVLGMGTVIFFTGSASSLLANTRQEKEVRYAMIHDESRCNGCNICARACRKTNHVPAQGSRLSIAHIPVTDNDNETQYHFFRQSCQHCEDAPCIDVCPTGASWRDEQGIVRVEKSQCIGCSYCIGACPYQVRYLNPVTKVADKCDFCAESRLAKGFPPICVSACPEHALIFGREDSPEIQAWLQQNKYYQYQLPGAGKPHLYRRFGQHLIKKENV
>NZ_CP029122.1|WP_001297805.1|2452015_2452654_+|YdhW-family-putative-oxidoreductase-system-protein
MNHRDELPLAKVSEVDEAKRQWLQGMRHPVDTVTEPEPAEILAEFIRQHSAAGQLVARAVFLSPPYSVAEEELSVLLESIKQNGDYADIACMTGSQDDYYYSTQAMSENYAAMSLQVVEQDICRAIAHAVRFECQTYPRPYKVAMLMQAPYYFQEAQIEAAIAAMDVAPEYADIRQVESSTAVLYLFSERFMTYGKAYGLCEWFEVEQFQNP
>NZ_CP029122.1|WP_001678907.1|2449900_2452003_+|aldehyde-ferredoxin-oxidoreductase
MANGWTGNILRVNLTTGNITLEDSSKFKSFVGGMGFGYKIMYDEVPPGTKPFDEANKLVFATGPLTGSGAPCSSRVNITSLSTFTKGNLVVDAHMGGFFAAQMKFAGYDVIIIEGKAKSPVWLKIKDDKVSLEKADFLWGKGTRATTEEICRLTSPETCVAAIGQAGENLVPLSGMLNSRNHSGGAGTGAIMGSKNLKAIAVEGTKGVNIADRQEMKRLNDYMMTELIGANNNHVVPSTPQSWAEYSDPKSRWTARKELFWGAAEGGPIETGEIPPGNQNTVGFRTYKSVFDLGPAAEKYTVKMSGCHSCPIRCMTQMNIPRVKEFGVPSTGGNTCVANFVHTTIFPNGPKDFEDKDDGRVIGNLVGLNLFDDYGLWCNYGQLHRDFTYCYSKGVFKRVLPAEEYAEIHWDQLEAGDVNFIKDFYYRLAHRVGELSHLADGSYAIAERWNLGEEYWGYAKNKLWSPFGYPVHHANEASAQVGSIVNCMFNRDCMTHTHINFIGSGLPLKLQREVAKELFGSEDAYDETKNYTPINDAKIKYAKWSLLRVCLHNAVTLCNWVWPMTVSPLKSRNYRGDLALEAKFFKAITGEEMTQEKLDLAAERIFTLHRAYTVKLMQTKDMRNEHDLICSWVFDKDPQIPVFTEGTDKMDRDDMHASLTMFYKEMGWDPQLGCPTRETLQRLGLEDIAADLAAHNLLPV
>NZ_CP029122.1|WP_001070230.1|2449253_2449880_+|ferredoxin-like-protein
MNPVDRPLLDIGLTRLEFLRISGKGLAGLTIAPALLSLLGCKQEDIDSGTVGLINTPKGVLVTQRARCTGCHRCEISCTNFNDGSVGTFFSRIKIHRNYFFGDNGVGSGGGLYGDLNYTADTCRQCKEPQCMNVCPIGAITWQQKEGCITVDHKRCIGCSACTTACPWMMATVNTESKKSSKCVLCGECANACPTGALKIIEWKDITV
>NZ_CP029122.1|WP_000528342.1|2448588_2448798_+|fumarate-hydratase-FumD
MGNRTKEDELYREMCRVVGKVVLEMRDLGQEPKHIVIAGVLRTALANKRIQRSELEKQAMETVINALVK
>NZ_CP029122.1|WP_001295403.1|2446620_2448033_-|pyruvate-kinase-PykF
MKKTKIVCTIGPKTESEEMLAKMLDAGMNVMRLNFSHGDYAEHGQRIQNLRNVMSKTGKTAAILLDTKGPEIRTMKLEGGNDVSLKAGQTFTFTTDKSVIGNSEMVAVTYEGFTTDLSVGNTVLVDDGLIGMEVTAIEGNKVICKVLNNGDLGENKGVNLPGVSIALPALAEKDKQDLIFGCEQGVDFVAASFIRKRSDVIEIREHLKAHGGENIHIISKIENQEGLNNFDEILEASDGIMVARGDLGVEIPVEEVIFAQKMMIEKCIRARKVVITATQMLDSMIKNPRPTRAEAGDVANAILDGTDAVMLSGESAKGKYPLEAVSIMATICERTDRVMNSRLEFNNDNRKLRITEAVCRGAVETAEKLDAPLIVVATQGGKSARAVRKYFPDATILALTTNEKTAHQLVLSKGVVPQLVKEITSTDDFYRLGKELALQSGLAHKGDVVVMVSGALVPSGTTNTASVHVL
>NZ_CP029122.1|WP_000534291.1|2457603_2458860_+|hypothetical-protein
MGSDAKNLMSDGNVQIVKTGEVIGATQLTEGELIVEAGGRAENTVVTGAGWLKVATGGIAKCTQYGNNGTLSVSDGAIATDIVQSEGGAISLSTLATVNGRHPEGEFSVDQGYACGLLLENGGNLRVLEGHRAEKIILDQEGGLLVNGTTSAVVVDEGGELLVYPGGEASNCEINQGGVFMLAGKASDTLLAGGTMNNLGGEDSDTIVENGSIYRLGTDGLQLYSSGKTQNLSVNVGGRAEVHAGTLENAVIQGGTVILLSPTSADENFVVEEDRAPVELTGSVALLDGASMIIGYGADLQQSTITVQQGGVLILDGSTVKGDGVTFIVGNINLNGGKLWLITGAATHVQLKVKRLRGEGAICLQTSAKEISPDFINVKGEVTGDIHVEITDASRQTLCNALKLQPDEDGIGATLQPA
>NZ_CP029122.1|WP_001174942.1|2458900_2460274_-|multidrug-efflux-MATE-transporter-MdtK
MQKYISEARLLLALAIPVILAQIAQTAMGFVDTVMAGGYSATDMAAVAIGTSIWLPAILFGHGLLLALTPVIAQLNGSGRRERIAHQVRQGFWLAGFVSVLIMLVLWNAGYIIRSMENIDPALADKAVGYLRALLWGAPGYLFFQVARNQCEGLAKTKPGMVMGFIGLLVNIPVNYIFIYGHFGMPELGGVGCGVATAAVYWVMFLAMVSYIKRARSMRDIRNEKGTAKPDPAVMKRLIQLGLPIALALFFEVTLFAVVALLVSPLGIVDVAGHQIALNFSSLMFVLPMSLAAAVTIRVGYRLGQGSTLDAQTAARTGLMVGVCMATLTAIFTVSLREQIALLYNDNPEVVTLAAHLMLLAAVYQISDSIQVIGSGILRGYKDTRSIFYITFTAYWVLGLPSGYILALTDLVVEPMGPAGFWIGFIIGLTSAAIMMMLRMRFLQRLPSVIILQRASR
>NZ_CP029122.1|WP_001373655.1|2460488_2461130_+|riboflavin-synthase
MFTGIVQGTVKLVSIDEKPNFRTHVVELPDHMLDGLETGASVAHNGCCLTVTEINGNHVSFDLMKETLRITNLGDLKVGDWVNVERAAKFSDEIGGHLMSGHIMTTAEVAKILTSENNRQIWFKVQDSQLMKYILYKGFIGIDGISLTVGEVTPTRFCVHLIPETLERTTLGKKKLGARVNIEIDPQTQAVVDTVERVLAARENAMNQPGTEA
>NZ_CP029122.1|WP_000098911.1|2461169_2462318_-|cyclopropane-fatty-acyl-phospholipid-synthase
MSSSCIEEVSVPDDNWYRIANELLSRAGIAINGSAPADIRVKNPDFFKRVLQEGSLGLGESYMDGWWECDRLDMFFSKVLRAGLENQLPHHFKDTLRIASARLFNLQSKKRAWIVGKEHYDLGNDLFSRMLDPFMQYSCAYWKDADNLESAQQAKLKMICEKLQLKPGMRVLDIGCGWGGLAHYMASNYDVSVVGVTISAEQQKMAQERCEGLDVTILLQDYRDLNDQFDRIVSVGMFEHVGPKNYDTYFAVVDRNLKPEGIFLLHTIGSKKTDLNVDPWINKYIFPNGCLPSVRQIAQSSEPHFVMEDWHNFGADYDTTLMAWYERFLAAWPEIADNYSERFKRMFTYYLNACAGAFRARDIQLWQVVFSRGVENGLRVAR
>NZ_CP029122.1|WP_001182363.1|2462608_2463820_-|Bcr/CflA-family-multidrug-efflux-MFS-transporter
MQPGKRFLVWLAGLSVLGFLATDMYLPAFAAIQADLQTPASAVSASLSLFLAGFAAAQLLWGPLSDRYGRKPVLLIGLTIFALGSLGMLWVENAATLLVLRFVQAVGVCAAAVIWQALVTDYYPSQKVNRIFATIMPLVGLSPALAPLLGSWLLVHFSWQAIFATLFAITVVLILPIFWLKPTTKARNNSQDGLTFTDLLRSKTYRGNVLIYAACSASFFAWLTGSPFILSEMGYSPAVIGLSYVPQTIAFLIGGYGCRAALQKWQGKQLLPWLLVLFAVSVIATWAAGFISHVSLVEILIPFCVMAIANGAIYPIVVAQALRPFPHATGRAAALQNTLQLGLCFLASLVVSWLISISTPLLTTTSVMLSTVVLVALGYMMQRCEEVGCQNHGNAEVAHSESH
>NZ_CP029122.1|WP_000269501.1|2463932_2464865_+|LysR-family-transcriptional-regulator
MWSEYSLEVVDAVARNGSFSAAAQELHRVPSAVSYTVRQLEEWLAVPLFERRHRDVELTAAGAWFLKEGRSVVKKMQITRQQCQQIANGWRGQLAIAVDNIVRPERTRQMIVDFYRHFDDVELLVFQEVFNGVWDALSDGRVELAIGATRAIPVGGRYAFRDMGMLSWSCVVASHHPLALMDGPFSDDTLRNWPSLVREDTSRTLPKRITWLLDNQKRVVVPDWESSATCISAGLCIGMVPTHFAKPWLNEGKWVALELENPFPDSACCLTWQQNDMSPALTWLLEYLGDSETLNKEWLREPEETPATGD
>NZ_CP029122.1|WP_000190982.1|2464861_2465887_-|HTH-type-transcriptional-repressor-PurR
MATIKDVAKRANVSTTTVSHVINKTRFVAEETRNAVWAAIKELHYSPSAVARSLKVNHTKSIGLLATSSEAAYFAEIIEAVEKNCFQKGYTLILGNAWNNLEKQRAYLSMMAQKRVDGLLVMCSEYPEPLLAMLEEYRHIPMVVMDWGEAKADFTDAVIDNAFEGGYMAGRYLIERGHREIGVIPGPLERNTGAGRLAGFMKAMEEAMIKVPESWIVQGDFEPESGYRAMQQILSQPHRPTAVFCGGDIMAMGALCAADEMGLRVPQDVSLIGYDNVRNARYFTPALTTIHQPKDSLGETAFNMLLDRIVNKREEPQSIEVHPRLIERRSVADGPFRDYRR
>NZ_CP029122.1|WP_000102278.1|2466185_2466275_+|stress-response-protein-YnhF
MSTDLKFSLVTTIIVLGLIVAVGLTAALH
>NZ_CP029122.1|WP_000701040.1|2466440_2467610_+|MFS-transporter
MKINYPLLALAIGAFGIGTTEFSPMGLLPVIARGVDVSIPAAGMLISAYAVGVMVGAPLMTLLLSHRARRSALIFLMAIFTLGNVLSAIAPDYMTLMLSRILTSLNHGAFFGLGSVVAASVVPKHKQASAVATMFMGLTLANIGGVPAATWLGETIGWRMSFLATAGLGVISMVSLFFSLPKGGAGARPEVKKELAVLMRPQVLSALLTTVLGAGAMFTLYTYISPVLQSITHATPVFVTAMLVLIGVGFSIGNYLGGKLADRSVNGTLKGFLLLLMVIMLAIPFLARNEFGAAISMVVWGAATFAVVPPLQMRVMRVASEAPGLSSSVNIGAFNLGNALGAAAGGAVISAGLGYSFVPVMGAIVAGLALLLVFMSARKQPETVCVANS
>NZ_CP029122.1|WP_000007283.1|2467755_2468337_-|superoxide-dismutase-[Fe]
MSFELPALPYAKDALAPHISAETIEYHYGKHHQTYVTNLNNLIKGTAFEGKSLEEIIRSSEGGVFNNAAQVWNHTFYWNCLAPNAGGEPTGKVAEAIAASFGSFADFKAQFTDAAIKNFGSGWTWLVKNSDGKLAIVSTSNAGTPLTTDATPLLTVDVWEHAYYIDYRNARPGYLEHFWALVNWEFVAKNLAA

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP029122_7

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP029122_7

3110425-3110516

Orphan

Consensus_repeat	Method
CCACCTTTTTTACCTGCTTCAGATGC	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_CP029122_7

>merge|NZ_CP029122|7|3110425-3110516|CRISPRCasFinder
CCACCTTTTTTACCTGCTTCAGATGCGCGCTGCGGGTCATTCTTGAAATTACCCCCGCTGTGCTGTCCACCTTTTTTACCTGCTTCTGATGC

>NZ_CP029122|7|7|3110425-3110516|CRISPRCasFinder
CCACCTTTTTTACCTGCTTCAGATGC	GCGCTGCGGGTCATTCTTGAAATTACCCCCGCTGTGCTGT
CCACCTTTTTTACCTGCTTCTGATGC

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP029122.1\|WP_001151437.1\|3110939_3111536_+\|NAD(P)H:quinone-oxidoreductase	unknown	unknown	gnl\|CDD\|179647
NZ_CP029122.1\|WP_001143120.1\|3111556_3111784_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|182285
NZ_CP029122.1\|WP_000097602.1\|3113354_3114614_-\|YccE-family-protein	unknown	unknown	gnl\|CDD\|182074
NZ_CP029122.1\|WP_001678465.1\|3098009_3099518_-\|sodium/proline-symporter-PutP	unknown	unknown	gnl\|CDD\|185317
NZ_CP029122.1\|WP_001345642.1\|3104867_3105959_+\|pyrimidine-utilization-protein-A	unknown	unknown	gnl\|CDD\|163355
NZ_CP029122.1\|WP_001126787.1\|3106662_3107049_+\|pyrimidine-utilization-protein-C	unknown	unknown	gnl\|CDD\|274677
NZ_CP029122.1\|WP_001299828.1\|3099939_3103902_+\|trifunctional-transcriptional-regulator/proline-dehydrogenase/L-glutamate-gamma-semialdehyde-dehydrogenase	unknown	unknown	gnl\|CDD\|236989
NZ_CP029122.1\|WP_000209869.1\|3116191_3116791_-\|molecular-chaperone-TorD	unknown	unknown	gnl\|CDD\|235326
NZ_CP029122.1\|WP_001001184.1\|3107866_3108457_+\|malonic-semialdehyde-reductase	unknown	unknown	gnl\|CDD\|180040
NZ_CP029122.1\|WP_001120112.1\|3120635_3121328_+\|two-component-system-response-regulator-TorR	unknown	unknown	gnl\|CDD\|182711
NZ_CP029122.1\|WP_001295606.1\|3103941_3104580_-\|HTH-type-transcriptional-regulator-RutR	unknown	unknown	gnl\|CDD\|184970
NZ_CP029122.1\|WP_000024560.1\|3115793_3116099_+\|chaperone-modulator-CbpM	unknown	unknown	gnl\|CDD\|182346
NZ_CP029122.1\|WP_001062101.1\|3116787_3119334_-\|trimethylamine-N-oxide-reductase-TorA	unknown	unknown	gnl\|CDD\|237909
NZ_CP029122.1\|WP_001323674.1\|3107056_3107857_+\|pyrimidine-utilization-protein-D	unknown	unknown	gnl\|CDD\|211851
NZ_CP029122.1\|WP_001323677.1\|3119333_3120506_-\|pentaheme-c-type-cytochrome-TorC	unknown	unknown	gnl\|CDD\|184992
NZ_CP029122.1\|WP_001345643.1\|3105958_3106651_+\|peroxyureidoacrylate/ureidoacrylate-amidohydrolase-RutB	unknown	unknown	gnl\|CDD\|163356
NZ_CP029122.1\|WP_001028095.1\|3108467_3108962_+\|pyrimidine-utilization-flavin-reductase-protein-F	unknown	unknown	gnl\|CDD\|132654
NZ_CP029122.1\|WP_001044313.1\|3111821_3113063_-\|bifunctional-glucose-1-phosphatase/inositol-phosphatase	unknown	unknown	gnl\|CDD\|182284
NZ_CP029122.1\|WP_000420629.1\|3114873_3115794_+\|curved-DNA-binding-protein	unknown	unknown	gnl\|CDD\|182347
NZ_CP029122.1\|WP_001347171.1\|3108982_3110311_+\|pyrimidine-utilization-transport-protein-G	unknown	unknown	gnl\|CDD\|132655

Protein	Function_ID	Function_description	E-value
NZ_CP029122.1\|WP_001151437.1\|3110939_3111536_+\|NAD(P)H:quinone-oxidoreductase	gnl\|CDD\|179647	PRK03767, PRK03767, NAD(P)H:quinone oxidoreductase; Provisional.	8.51484e-133
NZ_CP029122.1\|WP_001143120.1\|3111556_3111784_+\|hypothetical-protein	gnl\|CDD\|182285	PRK10174, PRK10174, hypothetical protein; Provisional.	8.66725e-44
NZ_CP029122.1\|WP_000097602.1\|3113354_3114614_-\|YccE-family-protein	gnl\|CDD\|182074	PRK09784, PRK09784, YccE family protein.	0
NZ_CP029122.1\|WP_001678465.1\|3098009_3099518_-\|sodium/proline-symporter-PutP	gnl\|CDD\|185317	PRK15419, PRK15419, sodium/proline symporter PutP.	0
NZ_CP029122.1\|WP_001345642.1\|3104867_3105959_+\|pyrimidine-utilization-protein-A	gnl\|CDD\|163355	TIGR03612, RutA, pyrimidine utilization protein A. This protein is observed in operons extremely similar to that characterized in E. coli K-12 responsible for the import and catabolism of pyrimidines, primarily uracil. This protein is a member of the luciferase family defined by pfam00296 and is likely a FMN-dependent monoxygenase. [Unknown function, Enzymes of unknown specificity].	0
NZ_CP029122.1\|WP_001126787.1\|3106662_3107049_+\|pyrimidine-utilization-protein-C	gnl\|CDD\|274677	TIGR03610, RutC, pyrimidine utilization protein C. This protein is observed in operons extremely similar to that characterized in E. coli K-12 responsible for the import and catabolism of pyrimidines, primarily uracil. This protein is a member of the endoribonuclease L-PSP family defined by pfam01042.	2.27835e-84
NZ_CP029122.1\|WP_001299828.1\|3099939_3103902_+\|trifunctional-transcriptional-regulator/proline-dehydrogenase/L-glutamate-gamma-semialdehyde-dehydrogenase	gnl\|CDD\|236989	PRK11809, putA, trifunctional transcriptional regulator/proline dehydrogenase/pyrroline-5-carboxylate dehydrogenase; Reviewed.	0
NZ_CP029122.1\|WP_000209869.1\|3116191_3116791_-\|molecular-chaperone-TorD	gnl\|CDD\|235326	PRK04976, torD, chaperone protein TorD; Validated.	5.28244e-84
NZ_CP029122.1\|WP_001001184.1\|3107866_3108457_+\|malonic-semialdehyde-reductase	gnl\|CDD\|180040	PRK05365, PRK05365, malonic semialdehyde reductase; Provisional.	1.24775e-128
NZ_CP029122.1\|WP_001120112.1\|3120635_3121328_+\|two-component-system-response-regulator-TorR	gnl\|CDD\|182711	PRK10766, PRK10766, two-component system response regulator TorR.	5.89892e-138
NZ_CP029122.1\|WP_001295606.1\|3103941_3104580_-\|HTH-type-transcriptional-regulator-RutR	gnl\|CDD\|184970	PRK15008, PRK15008, HTH-type transcriptional regulator RutR; Provisional.	3.3044e-153
NZ_CP029122.1\|WP_000024560.1\|3115793_3116099_+\|chaperone-modulator-CbpM	gnl\|CDD\|182346	PRK10265, PRK10265, chaperone modulator CbpM.	5.75956e-65
NZ_CP029122.1\|WP_001062101.1\|3116787_3119334_-\|trimethylamine-N-oxide-reductase-TorA	gnl\|CDD\|237909	PRK15102, PRK15102, trimethylamine-N-oxide reductase TorA.	0
NZ_CP029122.1\|WP_001323674.1\|3107056_3107857_+\|pyrimidine-utilization-protein-D	gnl\|CDD\|211851	TIGR03611, RutD, pyrimidine utilization protein D. This protein is observed in operons extremely similar to that characterized in E. coli K-12 responsible for the import and catabolism of pyrimidines, primarily uracil. This protein is a member of the hydrolase, alpha/beta fold family defined by pfam00067.	2.49482e-139
NZ_CP029122.1\|WP_001323677.1\|3119333_3120506_-\|pentaheme-c-type-cytochrome-TorC	gnl\|CDD\|184992	PRK15032, PRK15032, pentaheme c-type cytochrome TorC.	0
NZ_CP029122.1\|WP_001345643.1\|3105958_3106651_+\|peroxyureidoacrylate/ureidoacrylate-amidohydrolase-RutB	gnl\|CDD\|163356	TIGR03614, RutB, pyrimidine utilization protein B.	2.60527e-169
NZ_CP029122.1\|WP_001028095.1\|3108467_3108962_+\|pyrimidine-utilization-flavin-reductase-protein-F	gnl\|CDD\|132654	TIGR03615, flavoprotein_oxidoreductase, pyrimidine utilization flavin reductase protein F. This protein is observed in operons extremely similar to that characterized in E. coli K-12 responsible for the import and catabolism of pyrimidines, primarily uracil. This protein is a member of the flavin reductase family defined by pfam01613. Presumably, this protein recycles the flavin of the RutA luciferase-like oxidoreductase.	3.76111e-106
NZ_CP029122.1\|WP_001044313.1\|3111821_3113063_-\|bifunctional-glucose-1-phosphatase/inositol-phosphatase	gnl\|CDD\|182284	PRK10173, PRK10173, glucose-1-phosphatase/inositol phosphatase; Provisional.	0
NZ_CP029122.1\|WP_000420629.1\|3114873_3115794_+\|curved-DNA-binding-protein	gnl\|CDD\|182347	PRK10266, PRK10266, curved DNA-binding protein.	0
NZ_CP029122.1\|WP_001347171.1\|3108982_3110311_+\|pyrimidine-utilization-transport-protein-G	gnl\|CDD\|132655	TIGR03616, Putative_pyrimidine_permease_RutG, pyrimidine utilization transport protein G. This protein is observed in operons extremely similar to that characterized in E. coli K-12 responsible for the import and catabolism of pyrimidines, primarily uracil. This protein is a member of the uracil-xanthine permease family defined by TIGR00801. As well as the The Nucleobase:Cation Symporter-2 (NCS2) Family (TC 2.A.40).	0

>NZ_CP029122.1|WP_001347171.1|3108982_3110311_+|pyrimidine-utilization-transport-protein-G
MAMFGFPHWQLKSTSTESGVVAPDERLPFAQTAIMGVQHAVAMFGATVLMPILMGLDPNLSILMSGVGTLLFFFITGGRVPSYLGSSAAFVGVVIAATGFNGQGINPNISIALGGIIACGLVYTVIGLVVMKIGTRWIERLMPPVVTGAVVMAIGLNLAPIAVKSVSASAFDSWMAVMTVLCIGLVAVFTRGMIQRLLILVGLIVACLLYGVMTNLLGLGKAVDFTLVSHAAWFGLPHFSTPAFNSQAMMLIAPVAVILVAENLGHLKAVAGMTGRNMDPYMGRAFVGDGLATMLSGSVGGSGVTTYAENIGVMAVTKVYSTLVFVAAAVIAMLLGFSPKFGALIHTIPAAVIGGASIVVFGLIAVAGARIWVQNRVDLSQNGNLIMVAVTLVLGAGDFALTLGGFTLGGIGTATFGAILLNALLSRKLVDVPPPEVVHQEP
>NZ_CP029122.1|WP_001028095.1|3108467_3108962_+|pyrimidine-utilization-flavin-reductase-protein-F
MNIVDQQTFRDAMSCMGAAVNIITTDGPAGRAGFTASAVCSVTDTPPTLLVCLNRGASVWPVFNENRTLCVNTLSAGQEPLSNLFGGKTPMEHRFAAARWQTGVTGCPQLEEALVSFDCRISQVVSVGTHDILFCAIEAIHRHATPYGLVWFDRSYHALMRPAC
>NZ_CP029122.1|WP_001001184.1|3107866_3108457_+|malonic-semialdehyde-reductase
MNEAVSPGALSTLFTDARTHNGWRETPVSDETLRELYALMKWGPTSANCSPARIVFIRTAEGKERLRPALSSGNLQKTLTAPVTAIVAWDSEFYERLPLLFPHGDARSWFTSSPQLAEETAFRNSSMQAAYLIVACRALGLDTGPMSGFDRQYVDDAFFAGSTLKSNLLINIGYGDNSKLYARLPRLSFEEACGLL
>NZ_CP029122.1|WP_001323674.1|3107056_3107857_+|pyrimidine-utilization-protein-D
MKLSLSPPPYADAPVVVLISGLGGSGSYWLPQLAVLEQEYQVVCYDQRGTGNNPDTLAEDYSIAQMAAELHQALVAAGIEHYAVVGHALGALVGMQLALDYPASVTVLVCVNGWLRINAHTRRCFQVRERLLYSGGAQAWVEAQPLFLYPADWMAARAPRLEAEDALALAHFQGKNNLLRRLNALKRADFSHHAVRIRCPVQIICASDDLLVPSACSSELHAALPDSQKMVMRYGGHACNVTDPETFNALLLNGLASLLHHREAAL
>NZ_CP029122.1|WP_001126787.1|3106662_3107049_+|pyrimidine-utilization-protein-C
MPKSVIIPAGSSAPLAPFVPGTLADGVVYVSGTLAFDQHNNVLFADDPKAQTRHVLETIRTVIETAGGTMADVTFNSIFITDWKNYAAINEIYAEFFPGDKPARFCIQCGLVKPDALVEIATIAHIAK
>NZ_CP029122.1|WP_001345643.1|3105958_3106651_+|peroxyureidoacrylate/ureidoacrylate-amidohydrolase-RutB
MTTLTARPEAITFDPQQSALIVVDMQNAYATPGGYLDLAGFDVSTTRPVIANIQTAVTAARAAGMLIIWFQNGWDEQYVEAGGPGSPNFHKSNALKTMRKQPQLQGKLLAKGSWDYQLVDELVPQPGDIVLPKPRYSGFFNTPLDSILRSRGIRHLVFTGIATNVCVESTLRDGFFLEYFGVVLEDATHQAGPEFVQKAALFNIETFFGWVSDVETFCDALSPTSFARIA
>NZ_CP029122.1|WP_001345642.1|3104867_3105959_+|pyrimidine-utilization-protein-A
MKIGVFVPIGNNGWLISTHAPQYMPTFELNKAIVQKAEHYHFDFALSMIKLRGFGGKTEFWDHNLESFTLMAGLAAVTSRIQIYATAATLTLPPAIVARMAATIDSISGGRFGVNLVTGWQKPEYEQMGIWPGDDYFSRRYDYLTEYVQVLRDLWGSGKSDFKGDFFTMNDCRVSPQPSVPMKVICAGQSDAGMAFSAQYADFNFCFGKGVNTPTAFAPTAARMKQAAEQTGRDVGSYVLFMVIADETDDAARAKWEHYKAGADEEALSWLTEQSQKDTRSGTDTNVRQMADPTSAVNINMGTLVGSYASVARMLDEVASVPGAEGVLLTFDDFLSGIETFGERIQPLMQCRAHLPALTQEVA
>NZ_CP029122.1|WP_001295606.1|3103941_3104580_-|HTH-type-transcriptional-regulator-RutR
MTQGAVKTTGKRSRTVSAKKKAILSAALDTFSQFGFHGTRLEQIAELAGVSKTNLLYYFPSKEALYIAVLRQILDIWLAPLKAFREDFAPLAAIKEYIRLKLEVSRDYPQASRLFCMEMLAGAPLLMDELTGDLKALIDEKSALIAGWVKSGKLAPIDPQHLIFMIWASTQHYADFAPQVEAVTGATLRDEVFFNQTVENVQRIIIEGIRPR
>NZ_CP029122.1|WP_001299828.1|3099939_3103902_+|trifunctional-transcriptional-regulator/proline-dehydrogenase/L-glutamate-gamma-semialdehyde-dehydrogenase
MGTTTMGVKLDDATRERIKSAATRIDRTPHWLIKQAIFSYLEQLENSDTLPELPALLSGAANESDEAPTPAEEPHQPFLDFAEQILPQSVSRAAITAAYRRPETEAVSMLLEQARLPQPVAEQAHKLAYQLADKLRNQKNASGRAGMVQGLLQEFSLSSQEGVALMCLAEALLRIPDKATRDALIRDKISNGNWQSHIGRSPSLFVNAATWGLLFTGKLVSTHNEASLSRSLNRIIGKSGEPLIRKGVDMAMRLMGEQFVTGETIAEALANARKLEEKGFRYSYDMLGEAALTAADAQAYMVSYQQAIHAIGKASNGRGIYEGPGISIKLSALHPRYSRAQYDRVMEELYPRLKSLTLLARQYDIGINIDAEEADRLEISLDLLEKLCFEPELAGWNGIGFVIQAYQKRCPLVIDYLIDLATRSRRRLMIRLVKGAYWDSEIKRAQMDGLEGYPVYTRKVYTDVSYLACAKKLLAVPNLIYPQFATHNAHTLAAIYQLAGQNYYPGQYEFQCLHGMGEPLYEQVTGKVADGKLNRPCRIYAPVGTHETLLAYLVRRLLENGANTSFVNRIADTSLPLDELVADPVTAVEKLAQQEGQTGLPHPKIPLPRDLYGHGRDNSAGLDLANEHRLASLSSALLNSALQKWQALPMLEQPVAAGEMSPVINPAEPKDIVGFVREATPREVEQALESAVNNAPIWFATPPVERAAILHRAAVLMESQMQQLIGILVREAGKTFSNAIAEVREAVDFLHYYAGQVRDDFANETHRPLGPVVCISPWNFPLAIFTGQIAAALAAGNSVLAKPAEQTPLIAAQGIAILLEAGVPPGVVQLLPGQGETVGAQLTGDDRVRGVMFTGSTEVATLLQRNIASRLDAQGRPIPLIAETGGMNAMIVDSSALTEQVVVDVLASAFDSAGQRCSALRVLCLQDEIADHTLKMLRGAMAECRMGNPGRLTTDIGPVIDSEAKANIERHIQTMRSKGRPVFQAVRENSEDAREWQSGTFVAPTLIELDDFAELQKEVFGPVLHVVRYNRNQLPELIEQINASGYGLTLGVHTRIDETIAQVTGSAHVGNLYVNRNMVGAVVGVQPFGGEGLSGTGPKAGGPLYLYRLLANRPESALAVTLARQDAEYPVDAQLKAALTQPLNALREWAANRPELQALCTQYGELAQAGTQRLLPGPTGERNTWTLLPRERVLCIADDEQDALTQLAAVLAVGSQVLWPDDALHRQLVKALPSAVSERIQLAKAENITAQPFDAVIFHGDSDQLRALCEAVAARDGAIVSVQGFARGESNILLERLYIERSLSVNTAAAGGNASLMTIG
>NZ_CP029122.1|WP_001678465.1|3098009_3099518_-|sodium/proline-symporter-PutP
MAISTPMLVTFCVYIFGMILIGFIAWRSTKNFDDYILGGRSLGPFVTALSAGASDMSGWLLMGLPGAVFLSGISESWIAIGLTLGAWINWKLVAGRLRVHTEYNNNALTLPDYFTGRFEDKSRILRIISALVILLFFTIYCASGIVAGARLFESTFGMSYETALWAGAAATILYTFIGGFLAVSWTDTVQASLMIFALILTPVIVIISVGGFGDSLEVIKQKSIENVDMLKGLNFVAIISLMGWGLGYFGQPHILARFMAADSHHSIVHARRISMTWMILCLAGAVAVGFFGIAYFNEHPAVAGAVNQNAERVFIELAQILFNPWIAGILLSAILAAVMSTLSCQLLVCSSAITEDLYKAFLRKHASQKELVWVGRVMVLVVALVAIALAANPENRVLGLVSYAWAGFGAAFGPVVLFSVMWSRMTRNGALAGMIIGALTVIVWKQFGWLGVYEIIPGFIFGSIGIVVFSLLGKAPSAAMQKRFAEADAHYHSAPPSRLQES
>NZ_CP029122.1|WP_001151437.1|3110939_3111536_+|NAD(P)H:quinone-oxidoreductase
MAKVLVLYYSMYGHIETMARAVAEGASKVDGAEVVVKRVPETMPPQLFEKAGGKTQTAPVATPQELADYDAIIFGTPTRFGNMSGQMRTFLDQTGGLWASGALYGKLASVFSSTGTGGGQEQTITSTWTTLAHHGMVIVPIGYAAQELFDVSQVRGGTPYGATTIAGGDGSRQPSQEELSIARYQGEYVAGLAVKLNG
>NZ_CP029122.1|WP_001143120.1|3111556_3111784_+|hypothetical-protein
MPTQEAKAHHVGEWASLRNTSPEIAEAIFEVAGYDEKMAEKIWEEGSDEVLVKAFAKTDKDSLFWGEQTIERKNV
>NZ_CP029122.1|WP_001044313.1|3111821_3113063_-|bifunctional-glucose-1-phosphatase/inositol-phosphatase
MNKTLIAATVAGIVLLASNAQAQTVPEGYQLQQVLMMSRHNLRAPLANNGSVLEQSTPNKWPEWDVPGGQLTTKGGVLEVYMGHYMREWLAQQGMVKSGECPPPDTVYAYANSLQRTVATAQFFITGAFPGCDIPVHHQEKMGTMDPTFNPVITDDSAAFSEQAVAAMEKELSKLQLTDSYQLLEKIVNYKDSPACKEKQQCSLVDGKNTFSAKYQQEPGVSGPLKVGNSLVDAFTLQYYEGFPMDQVAWGEIKSDQQWKVLSKLKNGYQDSLFTSPEVARNVAKPLVSYIDKALVTDRTSAPKITVLVGHDSNIASLLTALDFKPYQLHDQNERTPIGGKIVFQRWHDSKANRDLMKIEYVYQSAEQLRNADALTLQAPAQRVTLELSGCPIDANGFCPMDKFDSVLNEAVK
>NZ_CP029122.1|WP_000097602.1|3113354_3114614_-|YccE-family-protein
MSSNIHGISCTANNYLKQAWNNIKNEHEKNQKYSITLFENTLVCFMRLYKEIRRQKAEDYIPCLECDSLEKEFEEMQNDNDLSLFLRTLRTNDTETYSGVSEGITYTIQYVRDIDIVRVSLPGRGSESITDFKGYYWYGFMEYIENINACDDVFSEYCLDDENMSIQPEWINTPGISDLDTGIDLSGISFIQSEINKTYGLKYAPVDGDGYCLLRAILVLKEHEYSWALGSHKTQKQVYEEFIKIVDKQTIEALVDTAFNDLREDVKTLFGVNLQSDNKIQGQGGFLSWSFLSFKKEFIDSCLNDKKCILHLPEFIFNDNKARLVLDTDPEQKVNEVKNFLTALSDSICSLFIVNSNVASISLGNESFSTDDDLEYGYLINTGNHYDVYLPPELFAQAYELNNKERNAQIDFLTRYAIY
>NZ_CP029122.1|WP_000420629.1|3114873_3115794_+|curved-DNA-binding-protein
MELKDYYAIMGVKPTDDLKTIKTAYRRLARKYHPDVSKEPDAEARFKEVAEAWEVLSDEQRRAEYDQMWQHRNDPQFNRQFHHSDGQSFNAEDFDDIFSSIFGQHARQSRQRPATRGHDIEIEVAVFLEETLTEHKRTISYNLPVYNAFGMIEQEIPKTLNVKIPAGVGNGQRIRLKGQGTPGENGGPNGDLWLVIHIAPHPLFDIVGHDLEIVVPVSPWEAALGAKVTVPTLKESILLTIPPGSQAGQRLRVKGKGLVSKKQTGDLYAVLKIVMPPKPDENTAALWQQLADAQSSFDPRKDWGKA
>NZ_CP029122.1|WP_000024560.1|3115793_3116099_+|chaperone-modulator-CbpM
MANVTVTFTITEFCLHTGISEEELNEIVGLGVVEPREIQETTWVFDDHAAIVVQRAVRLRHELALDWPGIAVALTLMDDIAHLKQENRLLRQRLSRFVAHP
>NZ_CP029122.1|WP_000209869.1|3116191_3116791_-|molecular-chaperone-TorD
MTTLTAQQIACVYAWLAQLFSRELDDEQLTQIASAQMAEWFSLLKSEPPLAAAVNELENCIATLTVRDDARLELAADFCGLFLMTDKQAALPYASAYKQDEQEIKRLLVEAGMETSGNFNEPADHLAIYLELLSHLHFSLGEGTVPARRIDSLRQKTLTALWQWLPEFVVRCRQYDSFGFYAALSQLLLVLVESDHQNR
>NZ_CP029122.1|WP_001062101.1|3116787_3119334_-|trimethylamine-N-oxide-reductase-TorA
MNNNDLFQASRRRFLAQLGGLTVAGMLGPSLLTPRRATAAQAATDAVISKEGILTGSHWGAIRATVKDGRFVAAKPFELDKYPSKMIAGLPDHVHNAARIRYPMVRVDWLRKRHLSDTSQRGDNRFVRVSWDEALDMFYEELERVQKTHGPSALLTASGWQSTGMFHNASGMLAKAIALHGNSVGTGGDYSTGAAQVILPRVVGSMEVYEQQTSWPLVLQNSKTIVLWGSDLLKNQQANWWCPDHDVYEYYAQLKAKVAAGEIEVISIDPVVTSTHEYLGREHVKHIAVNPQTDVPLQLALAYTLYSENLYDKNFLANYCVGFEQFLPYLLGEKDGQPKDAAWAEKLTGIDAETIRGLARQMAANRTQIIAGWCVQRMQHGEQWAWMIVVLAAMLGQIGLPGGGFGFGWHYNGAGTPGRKGVILSGFSGSTSIPPVHDNSDYKGYSSTIPIARFIDAILEPGKVINWNGKSVKLPPLKMCIFAGTNPFHRHQQINRIIEGWRKLETVIAIDNQWTSTCRFADIVLPATTQFERNDLDQYGNHSNRGIIAMKQVVPPQFEARNDFDIFRELCRRFNREEAFTEGLDEMGWLKRIWQEGVQQGKGRGVHLPAFDDFWNNKEYVEFDHPQMFVRHQAFREDPDLEPLGTPSGLIEIYSKTIADMNYDDCQGHPMWFEKIERSHGGPGSQKYPLHLQSVHPDFRLHSQLCESETLRQQYTVAGKEPVFINPQDASARGIRNGDVVRVFNARGQVLAGAVVSDRYAPGVARIHEGAWYDPDKGGEPGALCKYGNPNVLTIDIGTSQLAQATSAHTTLVEIEKYNGAVEQVTAFNGPVEMVAQCEYVPASQVKS
>NZ_CP029122.1|WP_001323677.1|3119333_3120506_-|pentaheme-c-type-cytochrome-TorC
MRKLWNALRRPSARWSVLALVAIGIVIGIALIVLPHVGIKVTSTTEFCVSCHSMQPVYEEYKQSVHFQNASGVRAECHDCHIPPDMPGMVKRKLEASNDIYQTFIAHSIDTPEKFEAKRAELAEREWARMKENNSATCRSCHNYDAMDHAKQHPEAARQMKVAAKDNQSCIDCHKGIAHQLPDMSSGFRKQFDELRASANDSGDTLYSIDIKPIYAAKGDKEASGSLLPASEVKVLKRDGDWLQIEITGWTESAGRQRVLTQFPGKRIFVASIRGDVQQQVKTLEKTTVADTNTEWSKLQATAWMKKGDMVNDIKPIWAYADSLYNGTCNQCHGAPEIAHFDANGWIGTLNGMIGFTSLDKREERTLLKYLQMNASDTAGKAHGDKKEEK
>NZ_CP029122.1|WP_001120112.1|3120635_3121328_+|two-component-system-response-regulator-TorR
MPHHIVIVEDEPVTQARLQSYFTQEGYTVSVTASGAGLREIMQNQPVDLILLDINLPDENGLMLTRALRERSTVGIILVTGRSDRIDRIVGLEMGADDYVTKPLELRELVVRVKNLLWRIDLARQAQPHTQDNCYRFAGYCLNVSRHTLERDGEPIKLTRAEYEMLVAFVTNPGEILSRERLLRMLSARRVENPDLRTVDVLIRRLRHKLSADLLVTQHGEGYFLAADVC

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP029122_8

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP029122_8

3414320-3414464

Orphan

Consensus_repeat	Method
GTAGGTCGGATAAGATGCGCAAGCATCGCATCCGACAATAAGTGCCGGATGC	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_CP029122_8

>merge|NZ_CP029122|8|3414320-3414464|CRISPRCasFinder
GTAGGTCGGATAAGATGCGCAAGCATCGCATCCGACAATAAGTGCCGGATGCTGCGAAAATGCCTTATCTGGCCTACAGATTCGATGCGATTCGTAGGTCGGATAAGATGCGCAAGCATCGCATCCGACAATAAGTGCCGAATGC

>NZ_CP029122|8|8|3414320-3414464|CRISPRCasFinder
GTAGGTCGGATAAGATGCGCAAGCATCGCATCCGACAATAAGTGCCGGATGC	TGCGAAAATGCCTTATCTGGCCTACAGATTCGATGCGATTC
GTAGGTCGGATAAGATGCGCAAGCATCGCATCCGACAATAAGTGCCGAATGC

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP029122.1\|WP_001372450.1\|3408671_3409352_+\|YqaJ-viral-recombinase-family-protein	unknown	unknown	gnl\|CDD\|378216
NZ_CP029122.1\|WP_001091569.1\|3412970_3414254_+\|putative-acyl-CoA-thioester-hydrolase	unknown	unknown	gnl\|CDD\|236709
NZ_CP029122.1\|WP_000679972.1\|3419676_3420630_+\|LysR-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|176131
NZ_CP029122.1\|WP_000120065.1\|3410517_3411120_-\|hypothetical-protein	unknown	unknown	unknown
NZ_CP029122.1\|WP_000545745.1\|3411362_3411530_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP029122.1\|WP_072126246.1\|3409348_3409531_+\|DUF1317-domain-containing-protein	unknown	unknown	gnl\|CDD\|284449
NZ_CP029122.1\|WP_000604034.1\|3423700_3424390_-\|molybdate-ABC-transporter-permease-subunit	unknown	unknown	gnl\|CDD\|181841
NZ_CP029122.1\|WP_001395510.1\|3409705_3409987_+\|cell-division-protein-ZapA	unknown	unknown	unknown
NZ_CP029122.1\|WP_000891515.1\|3425329_3425479_-\|multidrug-efflux-pump-accessory-protein-AcrZ	unknown	unknown	gnl\|CDD\|371231
NZ_CP029122.1\|WP_023148020.1\|3409503_3409695_+\|DUF1382-family-protein	unknown	unknown	gnl\|CDD\|369224
NZ_CP029122.1\|WP_001036475.1\|3416931_3418365_-\|anion-permease	unknown	unknown	gnl\|CDD\|279307
NZ_CP029122.1\|WP_001372427.1\|3418440_3419493_-\|4-oxalomesaconate-tautomerase	unknown	unknown	gnl\|CDD\|380230
NZ_CP029122.1\|WP_000101993.1\|3424389_3425163_-\|molybdate-ABC-transporter-substrate-binding-protein	unknown	unknown	gnl\|CDD\|182641
NZ_CP029122.1\|WP_000815449.1\|3420670_3421666_-\|6-phosphogluconolactonase	unknown	unknown	gnl\|CDD\|182912
NZ_CP029122.1\|WP_001372426.1\|3414487_3416749_-\|hydratase	unknown	unknown	gnl\|CDD\|183125
NZ_CP029122.1\|WP_000891692.1\|3422639_3423698_-\|molybdenum-ABC-transporter-ATP-binding-protein-ModC	unknown	unknown	gnl\|CDD\|182993
NZ_CP029122.1\|WP_000213425.1\|3421820_3422639_+\|bifunctional-pyridoxal-phosphate/fructose-1,6-bisphosphate-phosphatase	unknown	unknown	gnl\|CDD\|182523
NZ_CP029122.1\|WP_001303849.1\|3411569_3411788_+\|excisionase	unknown	unknown	gnl\|CDD\|116439
NZ_CP029122.1\|WP_000533646.1\|3411765_3412836_+\|tyrosine-type-recombinase/integrase	unknown	unknown	gnl\|CDD\|271181
NZ_CP029122.1\|WP_000763365.1\|3410085_3410307_+\|TraR/DksA-family-transcriptional-regulator	unknown	unknown	gnl\|CDD\|222775

Protein	Function_ID	Function_description	E-value
NZ_CP029122.1\|WP_001372450.1\|3408671_3409352_+\|YqaJ-viral-recombinase-family-protein	gnl\|CDD\|378216	pfam09588, YqaJ, YqaJ-like viral recombinase domain. This protein family is found in many different bacterial species but is of viral origin. The protein forms an oligomer and functions as a processive alkaline exonuclease that digests linear double-stranded DNA in a Mg(2+)-dependent reaction, It has a preference for 5'-phosphorylated DNA ends. It thus forms part of the two-component SynExo viral recombinase functional unit.	2.98824e-27
NZ_CP029122.1\|WP_001091569.1\|3412970_3414254_+\|putative-acyl-CoA-thioester-hydrolase	gnl\|CDD\|236709	PRK10531, PRK10531, putative acyl-CoA thioester hydrolase.	0
NZ_CP029122.1\|WP_000891515.1\|3425329_3425479_-\|multidrug-efflux-pump-accessory-protein-AcrZ	gnl\|CDD\|371231	pfam10766, AcrZ, Multidrug efflux pump-associated protein AcrZ. AcrZ is associated with the AcrA-TolC multidrug efflux pump, it may enhance the ability of the pump to recognize and export certain substrates.	1.04381e-17
NZ_CP029122.1\|WP_072126246.1\|3409348_3409531_+\|DUF1317-domain-containing-protein	gnl\|CDD\|284449	pfam07026, DUF1317, Protein of unknown function (DUF1317). This family consists of several hypothetical bacterial and phage proteins of around 60 residues in length. The function of this family is unknown.	8.0633e-35
NZ_CP029122.1\|WP_000604034.1\|3423700_3424390_-\|molybdate-ABC-transporter-permease-subunit	gnl\|CDD\|181841	PRK09421, modB, molybdate ABC transporter permease subunit.	2.41762e-146
NZ_CP029122.1\|WP_001372427.1\|3418440_3419493_-\|4-oxalomesaconate-tautomerase	gnl\|CDD\|380230	NF033377, OMA_tautomer, 4-oxalomesaconate tautomerase.	0
NZ_CP029122.1\|WP_023148020.1\|3409503_3409695_+\|DUF1382-family-protein	gnl\|CDD\|369224	pfam07131, DUF1382, Protein of unknown function (DUF1382). This family consists of several hypothetical Escherichia coli and bacteriophage lambda-like proteins of around 60 residues in length. The function of this family is unknown. Structural modelling suggests this domain may bind nucleic acids.	8.16312e-23
NZ_CP029122.1\|WP_001036475.1\|3416931_3418365_-\|anion-permease	gnl\|CDD\|279307	pfam00939, Na_sulph_symp, Sodium:sulfate symporter transmembrane region. There are also some members in this family that do not match the Prosite motif, and belong to the subfamily SODIT1.	0
NZ_CP029122.1\|WP_000679972.1\|3419676_3420630_+\|LysR-family-transcriptional-regulator	gnl\|CDD\|176131	cd08440, PBP2_LTTR_like_4, TThe C-terminal substrate binding domain of an uncharacterized LysR-type transcriptional regulator, contains the type 2 periplasmic binding fold. LysR-transcriptional regulators comprise the largest family of prokaryotic transcription factor. Homologs of some of LTTRs with similar domain organizations are also found in the archaea and eukaryotic organisms. The LTTRs are composed of two functional domains joined by a linker helix involved in oligomerization: an N-terminal HTH (helix-turn-helix) domain, which is responsible for the DNA-binding specificity, and a C-terminal substrate-binding domain, which is structurally homologous to the type 2 periplasmic binding proteins. As also observed in the periplasmic binding proteins, the C-terminal domain of the bacterial transcriptional repressor undergoes a conformational change upon substrate binding which in turn changes the DNA binding affinity of the repressor. The genes controlled by the LTTRs have diverse functional roles including amino acid biosynthesis, CO2 fixation, antibiotic resistance, degradation of aromatic compounds, nodule formation of nitrogen-fixing bacteria, and synthesis of virulence factors, to a name a few. This substrate-binding domain shows significant homology to the type 2 periplasmic binding proteins (PBP2), which are responsible for the uptake of a variety of substrates such as phosphate, sulfate, polysaccharides, lysine/arginine/ornithine, and histidine. The PBP2 bind their ligand in the cleft between these domains in a manner resembling a Venus flytrap. After binding their specific ligand with high affinity, they can interact with a cognate membrane transport complex comprised of two integral membrane domains and two cytoplasmically located ATPase domains. This interaction triggers the ligand translocation across the cytoplasmic membrane energized by ATP hydrolysis.	1.09679e-82
NZ_CP029122.1\|WP_000101993.1\|3424389_3425163_-\|molybdate-ABC-transporter-substrate-binding-protein	gnl\|CDD\|182641	PRK10677, modA, molybdate transporter periplasmic protein; Provisional.	0
NZ_CP029122.1\|WP_000815449.1\|3420670_3421666_-\|6-phosphogluconolactonase	gnl\|CDD\|182912	PRK11028, PRK11028, 6-phosphogluconolactonase; Provisional.	0
NZ_CP029122.1\|WP_001372426.1\|3414487_3416749_-\|hydratase	gnl\|CDD\|183125	PRK11413, PRK11413, putative hydratase; Provisional.	0
NZ_CP029122.1\|WP_000891692.1\|3422639_3423698_-\|molybdenum-ABC-transporter-ATP-binding-protein-ModC	gnl\|CDD\|182993	PRK11144, modC, molybdenum ABC transporter ATP-binding protein ModC.	0
NZ_CP029122.1\|WP_000213425.1\|3421820_3422639_+\|bifunctional-pyridoxal-phosphate/fructose-1,6-bisphosphate-phosphatase	gnl\|CDD\|182523	PRK10530, PRK10530, pyridoxal phosphate (PLP) phosphatase; Provisional.	0
NZ_CP029122.1\|WP_001303849.1\|3411569_3411788_+\|excisionase	gnl\|CDD\|116439	pfam07825, Exc, Excisionase-like protein. The phage-encoded excisionase protein (Xis) is involved in excisive recombination by regulating the assembly of the excisive intasome and by inhibiting viral integration. It adopts an unusual 'winged'-helix structure in which two alpha helices are packed against two extended strands. Also present in the structure is a two-stranded anti-parallel beta-sheet, whose strands are connected by a four-residue 'wing'. During interaction with DNA, helix alpha2 is thought to insert into the major groove, while the wing contacts the adjacent minor groove or phosphodiester backbone. The C-terminal region of Xis is involved in interaction with phage-encoded integrase (Int), and a putative C-terminal alpha helix may fold upon interaction with Int and/or DNA.	8.49552e-35
NZ_CP029122.1\|WP_000533646.1\|3411765_3412836_+\|tyrosine-type-recombinase/integrase	gnl\|CDD\|271181	cd00800, INT_Lambda_C, C-terminal catalytic domain of Lambda integrase, a tyrosine-based site-specific recombinase. Lambda-type integrases catalyze site-specific integration and excision of temperate bacteriophages and other mobile genetic elements to and from the bacterial host chromosome. They are tyrosine-based site-specific recombinase and belong to the superfamily of DNA breaking-rejoining enzymes, which share the same fold in their catalytic domain and the overall reaction mechanism. The phage lambda integrase can bridge two different and well-separated DNA sequences called arm- and core-sites. The C-terminal domain binds, cleaves and re-ligates DNA strands at the core-sites, while the N-terminal domain is largely responsible for high-affinity binding to the arm-type sites.	8.02573e-62
NZ_CP029122.1\|WP_000763365.1\|3410085_3410307_+\|TraR/DksA-family-transcriptional-regulator	gnl\|CDD\|222775	PHA00080, PHA00080, DksA-like zinc finger domain containing protein.	1.11886e-26

>NZ_CP029122.1|WP_001091569.1|3412970_3414254_+|putative-acyl-CoA-thioester-hydrolase
MNTFSVSRLALALAFGVTLTACSSTPPDQRPSDQTAPGTSSRPILSAKEAQNFDAQHYFASLTPGAAAWNPSPITLPAQPDFVVGPAGTQGVTHTTIQAAVDAAIIKRTNKRQYIAVMPGEYQGTVYVPAAPGGITLYGTGEKPIDVKIGLSLDGGMSPADWRHDVNPRGKYMPGKPAWYMYDSCQSKRSDSIGVLCSAVFWSQNNGLQLQNLTIENTLGDSVDAGNHPAVALRTDGDQVQINNVNILGRQNTFFVTNSGVQNRLETNRQPRTLVTNSYIEGDVDIVSGRGAVVFDNTEFRVVNSRTQQEAYVFAPATLSNIYYGFLAVNSRFNAFGDGVAQLGRSLDVDANTNGQVVIRDSAINEGFNTAKPWADAVISNRPFAGNTGSVDDNDEIQRNLNDTNYNRMWEYNNRGVGSKVVAEAKK
>NZ_CP029122.1|WP_000533646.1|3411765_3412836_+|tyrosine-type-recombinase/integrase
MGRRRSHERRDLPPNLYIRNNGYYCYRDPRTGKEFGLGRDRRIAITEAIQANIELFSGHKHKPLTARINSDNSVTLHSWLDRYEKILASRGIKQKTLINYMSKIKAIRRGLPDAPLEDITTKEIAAMLNGYIDEGKAASAKLIRSTLSDAFREAIAEGHITTNPVAATRAAKSEVRRSRLTADEYLKIYQAAESSPCWLRLAMELAVVTGQRVGDLCEMKWSDIVDGYLYVEQSKTGVKIAIPTVLHVDALGISMKETLDKCKEILGGETIIASTRREPLSSGTVSRYFMRARKASGLSFEGDPPTFHELRSLSARLYEKQISDKFAQHLLGHKSDTMASQYRDDRGREWDKIEIK
>NZ_CP029122.1|WP_001303849.1|3411569_3411788_+|excisionase
MYLTLQEWNARQRRPRSLETVRRWVRECRIFPPPVKDGREYLFHESAVKVDLNRPVTGSLLKRIRNGKKAKS
>NZ_CP029122.1|WP_000545745.1|3411362_3411530_+|hypothetical-protein
MHFRVTGEWNGEPFNRVIEAENISDCYDHWMLWAQIAHADVTNIRIEELKEHQAA
>NZ_CP029122.1|WP_000120065.1|3410517_3411120_-|hypothetical-protein
MSYFLRKKWMVNLSGSGKILWALNMKKDSYPYLICMTVSGLIFIFLFFWWRADIYRVTFLNQSISHYYILFSMGIAFLLSLFWVKKGIVKQSGWKSLSAYLKVYAGMCIFAGFFLIIPLTTLTYFLPGETSSYVAPYRYTSGSSKSCSGAEVDDPDLHENIRICYPYGNYEYDNIIYVEKKINILGAVVTYAQTARDDTE
>NZ_CP029122.1|WP_000763365.1|3410085_3410307_+|TraR/DksA-family-transcriptional-regulator
MADIIDSASEIEELQRNTAIKMRRLNHQAISATHCCECGDPIDERRRLAVQGCRTCASCQQDLELISKQRGSK
>NZ_CP029122.1|WP_001395510.1|3409705_3409987_+|cell-division-protein-ZapA
MHFSGSGLHILCAYACRHGACSMTPQQENALRSIARQANSEIKKARQQFPDKNVDDICRSVLKKHRETVTLMGFTPTHLSLAIGMLNGVFKER
>NZ_CP029122.1|WP_023148020.1|3409503_3409695_+|DUF1382-family-protein
MHKASPVELRTSIEMAHSLAQIGVRFVPIPVETDEEFHTLAAFLSQKLEMMVAKAEADERDQV
>NZ_CP029122.1|WP_072126246.1|3409348_3409531_+|DUF1317-domain-containing-protein
MTHPHDNIRVGAITFVYSVTKRGWVFPGLSVIRNPLKAQRLAEEINNKRGAVCTKHLPLS
>NZ_CP029122.1|WP_001372450.1|3408671_3409352_+|YqaJ-viral-recombinase-family-protein
MTPDIILQRTGIDVRAVEQGDDAWHKLRLGVITASEVHNVIAKPRSGKKWPDMKMSYFHTLLAEVCTGVAPEVNAKALAWGKQYENDARTLFEFTSSVNITESPIIYRDENMRTACSPDGLCSDGNGLELKCPFTSRDFMKFRLGGFEAIKSAYMAQVQYSMWVTRKDAWYFANYDPRMKREGLHYVVVERDEKYMASFDEMVPEFIEKMDEALAEIGFVFGEQWR
>NZ_CP029122.1|WP_001372426.1|3414487_3416749_-|hydratase
MIKLSEKGVFLASNNEIIAEEHFTGEIKKEEAQKGTIAWSILSSHNTSGNMDKLKIKFDSLASHDITFVGIVQTAKASGMERFPLPYVLTNCHNSLCAVGGTINGDDHVFGLSAAQRYGGIFVPPHIAVIHQYMREMMAGGGKMILGSDSHTRYGALGTMAVGEGGGELVKQLLNDTWDIDYPGVVAVHLTGKPAPYVGPQDVALAIIGAVFKNGYVKNKVMEFVGPGVSALSTDFRNSVDVMTTETTCLSSVWQTDEEVHNWLALHGRGQDYCQLNPQPMAYYDGCISVDLSAIKPMIALPFHPSNVYKIDTLNQNLTDILREIEIESERVAHGKAKLSLLDKVENGRLKVQQGIIAGCSGGNYENVIAAANALRGQSCGNDTFSLAVYPSSQPVFMDLAQKGVVADLIGAGAIIRTAFCGPCFGAGDTPINNGLSIRHTTRNFPNREGSKPANGQMSAVALMDARSIAATAANGGYLTSASELDCWDNVPEYAFDVTPYKNRVYQGFVKGATQQPLIYGPNIKDWPELGALTDNIVLKVCSKILDEVTTTDELIPSGETSSYRSNPIGLAEFTLSRRDPGYVGRSKATAELENQRLAGNVSELTEVFARIKQIAGQEHIDPLQTEIGSMVYAVKPGDGSAREQAASCQRVIGGLANIAEEYATKRYRSNVINWGMLPLQMAEVPTFEVGDYIYIPGIKAALDNPGTTFKGYVIHEDAPVTEITLYMGSLTAEEREIIKAGSLINFNKNRQM
>NZ_CP029122.1|WP_001036475.1|3416931_3418365_-|anion-permease
MNKKSLWKLILILAIPCIIGFMPAPAGLSELAWVLFGIYLAAIVGLVIKPFPEPVVLLIAVAASMVVVGNLSDGAFKTTAVLSGYSSGTTWLVFSAFTLSAAFVTTGLGKRIAYLLIGKIGNTTLGLGYVTVFLDLVLAPATPSNTARAGGIVLPIINSVAVALGSEPEKSPRRVGHYLMMSIYMVTKTTSYMFFTAMAGNILALKMINDILHLQISWGGWALAAGLPGIIMLLVTPLVIYTMYPPEIKKVDNKTIAKAGLAELGPMKIREKMLLGVFVLALLGWIFSKSLGVDESTVAIVVMATMLLLGIVTWEDVVKNKGGWNTLIWYGGIIGLSSLLSKVKFFEWLAEVFKNNLAFDGHGNVAFFVIIFLSIIVRYFFASGSAYIVAMLPVFAMLANVSGAPLMLTALALLFSNSYGGMVTHYGGAAGPVIFGVGYNDIKSWWLVGAVLTILTFLVHITLGVWWWNMLIGWNML
>NZ_CP029122.1|WP_001372427.1|3418440_3419493_-|4-oxalomesaconate-tautomerase
MKKIPCVMMRGGTSRGAFLLAEHLPEDQTQRDKILMAIMGSGNDLEIDGIGGGNPLTSKVAIISRSSDLRADVDYLFAQVIVHEQRVDTTPNCGNMLSGVGAFAIENGLIAATSPVTRVRIRNVNTGTFIEADVQTPNGVVEYEGSARIDGVPGTAAPVALTFLNAAGTKTGKVFPTDNQIDYFDDVPVTCIDMAMPVVIIPAEYLGKTGYELPAELDADKALLARIESIRLQAGKAMGLGDVSNMVIPKPVLISPAQKGGAINVRYFMPHSCHRALAITGAIAISSSCALEGTVTRQIVPSVGYGNINIEHPSGALDVHLSNEGQDATTLRASVIRTTRKIFSGEVYLP
>NZ_CP029122.1|WP_000679972.1|3419676_3420630_+|LysR-family-transcriptional-regulator
MKHELSSMKAFVILAESSSFNNAAKLLNITQPALTRRIKKMEEDLHIQLFERTTRKVTLTKAGKRLLPEARELIKKFDETLFNIRDMNAYHRGMVTLACIPTAVFYFLPLAIGKFNELYPNIKVRILEQGTNNCMESVLCNESDFGINMNNVTNSSIDFTPLVNEPFVLACRRDHPLAKKQLVEWQELVGYKMIGVRSSSGNRLLIEQQLADKPWKLDWFYEVRHLSTSLGLVEAGLGISALPGLAMPHAPYSSIIGIPLVEPVIRRTLGIIRRKDAVLSPAAERFFALLINLWTDDKDNLWTNIVERQRHALQEIG
>NZ_CP029122.1|WP_000815449.1|3420670_3421666_-|6-phosphogluconolactonase
MKQTVYIASPESQQIHVWNLNHEGALTLTQVVDVPGQVQPMVVSPDKRYLYVGVRPEFRVLAYSIAPDDGALTFAAESALPGSPTHISTDHQGQFVFVGSYNAGNVSVTRLEDGLPVGVVDVVEGLDGCHSANISPDNRTLWVPALKQDRICLFTVSDDGHLVAQDPAEVTTVEGAGPRHMVFHPNEQYAYCVNELNSSVDVWELKDPHGNIECVQTLDMMPENFSDTRWAADIHITPDGRHLYACDRTASLITVFSVSEDGSVLSKEGFQPTETQPRGFNVDHSGKYLIAAGQKSHHISVYEIVGEQGLLHEKGRYAVGQGPMWVVVNAH
>NZ_CP029122.1|WP_000213425.1|3421820_3422639_+|bifunctional-pyridoxal-phosphate/fructose-1,6-bisphosphate-phosphatase
MTTRVIALDLDGTLLTPKKTLLPSSIEALARAREAGYQLIIVTGRHHVAIHPFYQALALDTPAICCNGTYLYDYHAKTVLEADPMPVNKALQLIEMLNEHHIHGLMYVDDAMVYEHPTGHVIRTSNWAQTLPPEQRPTFTQVASLAETAQQVNAVWKFALTHDDLPQLQHFGKHVEHELGLECEWSWHDQVDIARGGNSKGKRLTKWVEAQGWSMENVVAFGDNFNDISMLEAAGTGVAMGNADDAVKARANIVIGDNTTDSIAQFIYSHLI
>NZ_CP029122.1|WP_000891692.1|3422639_3423698_-|molybdenum-ABC-transporter-ATP-binding-protein-ModC
MLELNFSQTLGNHCLTINETLPANGITAIFGVSGAGKTSLINAISGLTRPQKGRIVLNGRVLNDAEKGICLTPEKRRVGYVFQDARLFPHYKVRGNLRYGMSKSMVDQFDKLVALLGIEPLLDRLPGSLSGGEKQRVAIGRALLTAPELLLLDEPLASLDIPRKRELLPYLQRLTREINIPMLYVSHSLDEILHLADRVMVLENGQVKAFGALEEVWGSSVMNPWLPKEQQSSILKVTVLEHHPHYAMTALALGDQHLWVNKLDEPLQAALRIRIQASDVSLVLQPPQQTSIRNVLRAKVVNSYDDNGQVEVELEVGGKTLWARISPWARDELAIKPGLWLYAQIKSVSITA
>NZ_CP029122.1|WP_000604034.1|3423700_3424390_-|molybdate-ABC-transporter-permease-subunit
MILTDPEWQAVLLSLKVSSLAVLFSLPFGIFFAWLLVRCTFPGKALLDSVLHLPLVLPPVVVGYLLLVSMGRRGFIGERLYDWFGITFAFSWRGAVLAAAVMSFPLMVRAIRLALEGVDVKLEQAARTLGAGRWRVFFTITLPLTLPGIIVGTVLAFARSLGEFGATITFVSNIPGETRTIPSAMYTLIQTPGGESGAARLCIISIALAMISLLISEWLARISRERAGR
>NZ_CP029122.1|WP_000101993.1|3424389_3425163_-|molybdate-ABC-transporter-substrate-binding-protein
MARKWLNLFAGAALSFAVAGNALADEGKITVFAAASLTNAMQDIATQYKKEKGVDVVSSFASSSTLARQIEAGAPADLFISADQKWMDYAVDKKAIDTATRQTLLGNSLVVVAPKASEQKDFTIDSKTNWTSLLNGGRLAVGDPEHVPAGIYAKEALQKLGAWDTLSPKLAPAEDVRGALALVERNEAPLGIVYGSDAVASKGVKVVAIFPEDSHKKVEYPVAVVEGHNNATVKAFYDYLKGPQAAEIFKRYGFTTK
>NZ_CP029122.1|WP_000891515.1|3425329_3425479_-|multidrug-efflux-pump-accessory-protein-AcrZ
MLELLKSLVFAVIMVPVVMAIILGLIYGLGEVFNIFSGVGKKDQPGQNH

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP029122_9

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP029122_9

3910465-3910618

Orphan

Consensus_repeat	Method
CGCCTTATCCGGCCTACCGATCCAGCACAGGTTTGTAGGCATGATAAGACGCG	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_CP029122_9

>merge|NZ_CP029122|9|3910465-3910618|CRISPRCasFinder
CGCCTTATCCGGCCTACCGATCCAGCACAGGTTTGTAGGCATGATAAGACGCGTCAGCGTCGCATCAGGCATCTGCGCATAACCGCCGGATGCGGCGTAAACGCCTTATCCGGCCTACCGATCCGGCACAGGTTTGTAGGCATGATAAGACGCG

>NZ_CP029122|9|9|3910465-3910618|CRISPRCasFinder
CGCCTTATCCGGCCTACCGATCCAGCACAGGTTTGTAGGCATGATAAGACGCG	TCAGCGTCGCATCAGGCATCTGCGCATAACCGCCGGATGCGGCGTAAA
CGCCTTATCCGGCCTACCGATCCGGCACAGGTTTGTAGGCATGATAAGACGCG

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP029122.1\|WP_001291992.1\|3903179_3903638_-\|xanthine-phosphoribosyltransferase	unknown	unknown	gnl\|CDD\|236395
NZ_CP029122.1\|WP_000284050.1\|3914054_3914633_-\|D-sedoheptulose-7-phosphate-isomerase	unknown	unknown	gnl\|CDD\|179012
NZ_CP029122.1\|WP_000978828.1\|3920195_3920645_-\|hypothetical-protein	unknown	unknown	unknown
NZ_CP029122.1\|WP_000189539.1\|3901843_3903088_-\|esterase-FrsA	unknown	unknown	gnl\|CDD\|235337
NZ_CP029122.1\|WP_000006256.1\|3910647_3911145_-\|REP-associated-tyrosine-transposase-RayT	unknown	unknown	gnl\|CDD\|224854
NZ_CP029122.1\|WP_001087742.1\|3925557_3926910_+\|membrane-protein	unknown	unknown	gnl\|CDD\|226046
NZ_CP029122.1\|WP_001059874.1\|3906285_3906738_-\|GNAT-family-N-acetyltransferase	unknown	unknown	gnl\|CDD\|182099
NZ_CP029122.1\|WP_000952760.1\|3908590_3910330_+\|flagellar-type-III-secretion-system-protein-FlhA	unknown	unknown	gnl\|CDD\|224217
NZ_CP029122.1\|WP_000973093.1\|3914872_3917317_+\|acyl-CoA-dehydrogenase-FadE	unknown	unknown	gnl\|CDD\|236528
NZ_CP029122.1\|WP_000174677.1\|3901384_3901786_-\|sigma-factor-binding-protein-Crl	unknown	unknown	gnl\|CDD\|182882
NZ_CP029122.1\|WP_001225679.1\|3912370_3913111_+\|murein-L,D-transpeptidase	unknown	unknown	gnl\|CDD\|225577
NZ_CP029122.1\|WP_001295202.1\|3905712_3905979_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|181972
NZ_CP029122.1\|WP_032283079.1\|3907860_3908646_-\|putative-lateral-flagellar-export/assembly-protein-LafU	unknown	unknown	gnl\|CDD\|235860
NZ_CP029122.1\|WP_001118055.1\|3917986_3918757_+\|2-oxoglutaramate-amidase	unknown	unknown	gnl\|CDD\|182461
NZ_CP029122.1\|WP_000532698.1\|3917359_3917833_-\|C-lysozyme-inhibitor	unknown	unknown	gnl\|CDD\|182187
NZ_CP029122.1\|WP_000009291.1\|3911320_3912079_-\|C40-family-peptidase	unknown	unknown	gnl\|CDD\|223862
NZ_CP029122.1\|WP_000333380.1\|3913081_3913849_-\|class-II-glutamine-amidotransferase	unknown	unknown	gnl\|CDD\|372525
NZ_CP029122.1\|WP_000749881.1\|3900290_3901346_+\|phosphoporin-PhoE	unknown	unknown	gnl\|CDD\|182275
NZ_CP029122.1\|WP_001226155.1\|3906734_3907790_-\|DNA-polymerase-IV	unknown	unknown	gnl\|CDD\|235035
NZ_CP029122.1\|WP_001293003.1\|3903898_3905356_+\|cytosol-nonspecific-dipeptidase	unknown	unknown	gnl\|CDD\|184986

Protein	Function_ID	Function_description	E-value
NZ_CP029122.1\|WP_001291992.1\|3903179_3903638_-\|xanthine-phosphoribosyltransferase	gnl\|CDD\|236395	PRK09177, PRK09177, xanthine-guanine phosphoribosyltransferase; Validated.	5.05624e-113
NZ_CP029122.1\|WP_000284050.1\|3914054_3914633_-\|D-sedoheptulose-7-phosphate-isomerase	gnl\|CDD\|179012	PRK00414, gmhA, D-sedoheptulose 7-phosphate isomerase.	1.61173e-142
NZ_CP029122.1\|WP_000189539.1\|3901843_3903088_-\|esterase-FrsA	gnl\|CDD\|235337	PRK05077, frsA, esterase FrsA.	0
NZ_CP029122.1\|WP_000006256.1\|3910647_3911145_-\|REP-associated-tyrosine-transposase-RayT	gnl\|CDD\|224854	COG1943, COG1943, Transposase and inactivated derivatives [DNA replication, recombination, and repair].	7.32036e-43
NZ_CP029122.1\|WP_001087742.1\|3925557_3926910_+\|membrane-protein	gnl\|CDD\|226046	COG3515, COG3515, Predicted component of the type VI protein secretion system [Intracellular trafficking, secretion, and vesicular transport].	1.90242e-77
NZ_CP029122.1\|WP_001059874.1\|3906285_3906738_-\|GNAT-family-N-acetyltransferase	gnl\|CDD\|182099	PRK09831, PRK09831, GNAT family N-acetyltransferase.	4.77997e-103
NZ_CP029122.1\|WP_000952760.1\|3908590_3910330_+\|flagellar-type-III-secretion-system-protein-FlhA	gnl\|CDD\|224217	COG1298, FlhA, Flagellar biosynthesis pathway, component FlhA [Cell motility and secretion / Intracellular trafficking and secretion].	0
NZ_CP029122.1\|WP_000973093.1\|3914872_3917317_+\|acyl-CoA-dehydrogenase-FadE	gnl\|CDD\|236528	PRK09463, fadE, acyl-CoA dehydrogenase; Reviewed.	0
NZ_CP029122.1\|WP_000174677.1\|3901384_3901786_-\|sigma-factor-binding-protein-Crl	gnl\|CDD\|182882	PRK10984, PRK10984, sigma factor-binding protein Crl.	1.11584e-87
NZ_CP029122.1\|WP_001225679.1\|3912370_3913111_+\|murein-L,D-transpeptidase	gnl\|CDD\|225577	COG3034, COG3034, Uncharacterized protein conserved in bacteria [Function unknown].	1.07529e-116
NZ_CP029122.1\|WP_001295202.1\|3905712_3905979_-\|hypothetical-protein	gnl\|CDD\|181972	PRK09588, PRK09588, hypothetical protein; Reviewed.	1.93527e-42
NZ_CP029122.1\|WP_032283079.1\|3907860_3908646_-\|putative-lateral-flagellar-export/assembly-protein-LafU	gnl\|CDD\|235860	PRK06778, PRK06778, hypothetical protein; Validated.	2.0421e-172
NZ_CP029122.1\|WP_001118055.1\|3917986_3918757_+\|2-oxoglutaramate-amidase	gnl\|CDD\|182461	PRK10438, PRK10438, C-N hydrolase family amidase; Provisional.	0
NZ_CP029122.1\|WP_000532698.1\|3917359_3917833_-\|C-lysozyme-inhibitor	gnl\|CDD\|182187	PRK09993, PRK09993, C-lysozyme inhibitor; Provisional.	9.39999e-93
NZ_CP029122.1\|WP_000009291.1\|3911320_3912079_-\|C40-family-peptidase	gnl\|CDD\|223862	COG0791, Spr, Cell wall-associated hydrolases (invasion-associated proteins) [Cell envelope biogenesis, outer membrane].	3.3314e-41
NZ_CP029122.1\|WP_000333380.1\|3913081_3913849_-\|class-II-glutamine-amidotransferase	gnl\|CDD\|372525	pfam13230, GATase_4, Glutamine amidotransferases class-II. This family captures members that are not found in pfam00310.	8.29603e-146
NZ_CP029122.1\|WP_000749881.1\|3900290_3901346_+\|phosphoporin-PhoE	gnl\|CDD\|182275	PRK10159, PRK10159, phosphoporin PhoE.	0
NZ_CP029122.1\|WP_001226155.1\|3906734_3907790_-\|DNA-polymerase-IV	gnl\|CDD\|235035	PRK02406, PRK02406, DNA polymerase IV; Validated.	0
NZ_CP029122.1\|WP_001293003.1\|3903898_3905356_+\|cytosol-nonspecific-dipeptidase	gnl\|CDD\|184986	PRK15026, PRK15026, aminoacyl-histidine dipeptidase; Provisional.	0

>NZ_CP029122.1|WP_000952760.1|3908590_3910330_+|flagellar-type-III-secretion-system-protein-FlhA
MLSRSDLLTLLTINFIVVTKGAERISEVSARFTLDAMPGKQMAIDADLNAGLINQAQAQTRRKDVASEADFYGAMDGASKFVRGDAIAGMMILAINLIGGVCIGIFKYNLSADAAFQQYVLMTIGDGLVAQIPSLLLSTAAAIIVTRISDNGDITHDVRHQLLASPSVLYTATGIMFVLAVVPGMPHLPFLLFSALLGFTGWRMSKRPQAAEAEEKSLETLTRTITETSEQQVSWETIPLIEPISLSLGYKLVALVDKAQGNPLTQRIRGVRQVISDGNGVLLPEIRIRENFRLKPSQYAIFINGIKADEADIPADKLMALPSSETYGEIDGVLGNDPAYGMPVTWIQPAQKAKALNMGYQVIDSASVIATHVNKIVRSYIPDLFSYDDITQLHNRLSSMAPRLAEDLSAALNYSQLLKVYRALLTEGVSLRDIVTIATVLVASSAVTKDHILLAADVRLALRRSITHPFVRKQELTVYTLNNELENLLTNVVNQAQQGGKVMLDSVPVDPNMLNQFQSTMPQVKEQMKAAGKDPVLLVPPQLRPLLARYARLFAPGLHVLSYNEVPDELELKIMGALM
>NZ_CP029122.1|WP_032283079.1|3907860_3908646_-|putative-lateral-flagellar-export/assembly-protein-LafU
MTTIKLIVNSVSKSERESIIAALHGQSIFSGGGLSPLNKISPSHPPKPATVAVPEETEKKARDVNEKTALLKKKSATELGELATSINTIARDAHMEANLEMEIVPQGLRVLIKDDQNRNMFECGSAQIMPFFKTLLVELAPVFDSLDNKIIITGHTDAMAYKNNIYNNWNLSGDRALSARRVLEEAGMPEDKVMQVSAMADQMLLDAKNPQSAGNRRIEIMVLTKSASDTLYQYFGQHGDKVVQPLVQKLDKQQVLSQRMR
>NZ_CP029122.1|WP_001226155.1|3906734_3907790_-|DNA-polymerase-IV
MRKIIHVDMDCFFAAVEMRDNPALRDIPIAIGGSRERRGVISTANYPARKFGVRSAMPTGMALKLCPHLTLLPGRFDAYKEASNHIREIFSRYTSRIEPLSLDEAYLDVTDSVHCHGSATLIAQEIRQTIFNELHLTASAGVAPVKFLAKIASDMNKPNGQFVITPAEVPAFLQTLPLAKIPGVGKVSAAKLEAMGLRTCGDVQKCDLVILLKRFGKFGRILWERSQGIDERDVNSERLRKSVGVERTMAEDIHHWSECEAIIERLYPELERRLAKVKPDLLIARQGVKLKFDDFQQTTQEHVWPRLNKADLIATARKTWDERRGGRGVRLVGLHVTLLDPQMERQLVLGL
>NZ_CP029122.1|WP_001059874.1|3906285_3906738_-|GNAT-family-N-acetyltransferase
MNNIQIRNYQPGDFQQLCAIFIRAVMMTASQHYSPQQIAAWAQIDESRWKEKLAKSQVRVAVINAQPVGFISRIERHIDMLFVDPEYTRRGVASALLKPLIKSESELTVDASITAKPFFERYGFQIVKQQHVECRGAWFTNFYMRYKPQH
>NZ_CP029122.1|WP_001295202.1|3905712_3905979_-|hypothetical-protein
MEWYMGKYIRPLSDAVFTIASDDLWIESLAIQQLHTTANLPNMQRVVGMPDLHPGRGYPIGAAFFSVGRFYPARRRGNGAGNRNGPLL
>NZ_CP029122.1|WP_001293003.1|3903898_3905356_+|cytosol-nonspecific-dipeptidase
MSELSQLSPQPLWDIFAKICSIPHPSYHEEQLAEYIVGWAKEKGFHVERDQVGNILIRKPATAGMENRKPVVLQAHLDMVPQKNNDTVHDFTKDPIQPYIDGEWVKARGTTLGADNGIGMASALAVLADENVVHGPLEVLLTMTEEAGMDGAFGLQSNWLQADILINTDSEEEGEIYMGCAGGIDFTSNLHLDREAVPAGFETFKLTLKGLKGGHSGGEIHVGLGNANKLLVRFLAGHAEELDLRLIDFNGGTLRNAIPREAFATIAVAADKVDALKSLVNTYQDILKNELAEKEKNLALLLDSVANDKAALIAKSRDTFIRLLNATPNGVIRNSDVAKGVVETSLNVGVVTMTDNNVEIHCLIRSLIDSGKDYVVSMLDSLGKLAGAKTEAKGAYPGWQPDANSPVMHLVRETYQRLFNKTPNIQIIHAGLECGLFKKPYPEMDMVSIGPTITGPHSPDEQVHIKSVGHYWTLLTELLKEIPAK
>NZ_CP029122.1|WP_001291992.1|3903179_3903638_-|xanthine-phosphoribosyltransferase
MSEKYIVTWDMLQIHARKLASRLMPSEQWKGIIAVSRGGLVPGALLARELGIRHVDTVCISSYDHDNQRELKVLKRAEGDGEGFIVIDDLVDTGGTAVAIREMYPKAHFVTIFAKPAGRPLVDNYVVDIPQDTWIEQPWDMGVVFVPPISGR
>NZ_CP029122.1|WP_000189539.1|3901843_3903088_-|esterase-FrsA
MTQANLSETLFKPRFKHPETSTLVRRFNHGAQPPVQSALDGKTIPHWYRMINRLMWIWRGIDPREILDVQARIVMSDAERTDDDLYDTVIGYRGGNWIYEWATQAMVWQQKACAEEDPQLSGRHWLHAATLYNIAAYPHLKGDDLAEQAQALSNRAYEEAAQRLPGTMRQMEFTVPGGAPITGFLHMPKGDGPFPTVLMCGGLDAMQTDYYSLYERYFAPRGIAMLTIDMPSVGFSSKWKLTQDSSLLHQHVLKALPNVPWVDHTRVAAFGFRFGANVAVRLAYLESPRLKAVACLGPVVHTLLSDFKCQQQVPEMYLDVLASRLGMHDASDDALRVELNRYSLKVQGLLGRRCPTPMLSGYWKNDPFSPEEDSRLITSSSADGKLLEIPFNPVYRNFDKGLQEITGWIEKRLC
>NZ_CP029122.1|WP_000174677.1|3901384_3901786_-|sigma-factor-binding-protein-Crl
MTLPSGHPKSRLIKKFTALGPYIREGKCEDNRFFFDCLAVCVNVKPAPEVREFWGWWMELEAQESRFTYSYQFGLFDKAGDWKSVPVKDTEVVERLEHTLREFHEKLRELLTTLNLKLEPADDFRDEPVKLTA
>NZ_CP029122.1|WP_000749881.1|3900290_3901346_+|phosphoporin-PhoE
MKKSTLALVVMGIVASASVQAAEIYNKDGNKLDVYGKVKAMHYMSDNDSKDGDQSYIRFGFKGETQINDQLTGYGRWEAEFAGNKAESDTAQQKTRLAFAGLKYKDLGSFDYGRNLGALYDVEAWTDMFPEFGGDSSAQTDNFMTKRASGLATYRNTDFFGVIDGLNLTLQYQGKNENRDVKKQNGDGFGTSLTYDFGGSDFAISGAYTNSDRTNEQNLQSRGTGKRAEAWATGLKYDANNIYLATFYSETRKMTPITGGFANKTQNFEAVAQYQFDFGLRPSLGYVLSKGKDIEGIGDEDLVNYIDVGATYYFNKNMSAFVDYKINQLDSDNKLNINNDDIVAVGMTYQF
>NZ_CP029122.1|WP_000006256.1|3910647_3911145_-|REP-associated-tyrosine-transposase-RayT
MSEYRRYYIKGGTWFFTVNLRNRRSQLLTTQYQMLRHAIIKVKRDRPFEINAWVVLPEHMHCIWTLPEGDDDFSSRWREIKKQFTHACGLKNIWQPRFWEHAIRNTKDYRHHVDYIYINPVKHGWVKQVSDWPFSTFHRDVARGLYPIDWAGDVTDINAGERIIL
>NZ_CP029122.1|WP_000009291.1|3911320_3912079_-|C40-family-peptidase
MSFMSSFLLGRFLHPGVFSLCVLLPLFASATTSHISFSYAARQRMQNRARLLKQYQTHLKKQASYIVEGNAESRRALRQHNREQIKQHPEWFPAPLKASDRRWQALAENNHFLSSDHLHNITEVAIHRLEQQLGKPYVWGGTRPDQGFDCSGLVFYAYNKILEAKLPRTANEMYHYHRATIVANNDLRRGDLLFFHIHSREIADHMGVYLGDGQFIESPRTGENIRVSRLAEPFWQDHFLGARRILTEETIL
>NZ_CP029122.1|WP_001225679.1|3912370_3913111_+|murein-L,D-transpeptidase
MRKIALILAMLLIPCVSFAGLLGSSSSTTPVSKEYKQQLMGSPVYIQIFKEERTLDLYVKMGEQYQLLDSYKICKYSGGLGPKQRQGDFKSPEGFYSVQRNQLKPDSRYYKAINIGFPNAYDRAHGYEGKYLMIHGDCVSIGCYAMTNQGIDEIFQFVTGALVFGQPSVQVSIYPFRMTDANMKRHKYSNFKDFWEQLKPGYDYFEQTRKPPTVSVVNGRYVVSKPLSHEVVQPQLASNYTLPEAK
>NZ_CP029122.1|WP_000333380.1|3913081_3913849_-|class-II-glutamine-amidotransferase
MCELLGMSANVPTDICFSFTGLVQRGGGTGPHKDGWGITFYEGKGCRTFKDPQPSFNSPIAKLVQDYPIKSCSVVAHIRQANRGEVALENTHPFTRELWGRNWTYAHNGQLTGYKSLETGNFRPVGETDSEKAFCWLLHKLTQRYPRTPGNMAAVFKYIASLADELRQKGVFNMLLSDGRYVMAYCSTNLHWITRRAPFGVATLLDQDVEIDFSSQTTPNDVVTVIATQPLTGNETWQKIMPGEWRLFCLGERVV
>NZ_CP029122.1|WP_000284050.1|3914054_3914633_-|D-sedoheptulose-7-phosphate-isomerase
MYQDLIRNELNEAAETLANFLKDDANIHAIQRAAVLLADSFKAGGKVLSCGNGGSHCDAMHFAEELTGRYRENRPGYPAIAISDVSHISCVGNDFGFNDIFSRYVEAVGREGDVLLGISTSGNSANVIKAIAAAREKGMKVITLTGKDGGKMAGTADIEIRVPHFGYADRIQEIHIKVIHILIQLIEKEMVK
>NZ_CP029122.1|WP_000973093.1|3914872_3917317_+|acyl-CoA-dehydrogenase-FadE
MMILSILATVVLLGALFYHRVSLFISSLILLAWTAALGVAGLWSAWVLVPLAIILVPFNFAPMRKSMISAPVFRGFRKVMPPMSRTEKEAIDAGTTWWEGDLFQGKPDWKKLHNYPQPRLTAEEQAFLDGPVEEACRMANDFQITHELADLPPELWAYLKEHRFFAMIIKKEYGGLEFSAYAQSRVLQKLSGVSGILAITVGVPNSLGPGELLQHYGTDEQKNHYLPRLARGQEIPCFALTSPEAGSDAGAIPDTGIVCMGEWQGQQVLGMRLTWNKRYITLAPIATVLGLAFKLSDPEKLLGGAEDLGITCALIPTTTPGVEIGRRHFPLNVPFQNGPTRGKDVFVPIDYIIGGPKMAGQGWRMLVECLSVGRGITLPSNSTGGVKSVALATGAYAHIRRQFKISIGKMEGIEEPLARIAGNAYVMDAAASLITYGIMLGEKPAVLSAIVKYHCTHRGQQSIIDAMDITGGKGIMLGQSNFLARAYQGAPIAITVEGANILTRSMMIFGQGAIRCHPYVLEEMEAAKNNDVNAFDKLLFKHIGHVGSNKVRSFWLGLTRGLTSSTPTGDATKRYYQHLNRLSANLALLSDVSMAVLGGSLKRRERISARLGDILSQLYLASAVLKRYDDEGRNEADLPLVHWGVQDALYQAEQAMDDLLQNFPNRVVAGLLNVVIFPTGRHYLAPSDKLDHKVAKILQVPNATRSRIGRGQYLTPSEHNPVGLLEEALVDVIAADPIHQRICKELGKNLPFTRLDELAHNALAKGLIDKDEAAILVKAEESRLCSINVDDFDPEELATKPVKLPEKVRKVEAA
>NZ_CP029122.1|WP_000532698.1|3917359_3917833_-|C-lysozyme-inhibitor
MGRISSGGMMFKAITTVAALVIATSAMAQDDLTISSLAKGETTKAAFNQMVQGHKLPAWVMKGGTYTPAQTVTLGDETYQVMSACKPHDCGSQRIAVMWSEKSNQMTGLFSTIDEKTSQEKLTWLNVNDALSIDGKTVLFAALTGSLENHPDGFNFK
>NZ_CP029122.1|WP_001118055.1|3917986_3918757_+|2-oxoglutaramate-amidase
MPGLKITLLQQPLVWMDGPANLRHFDRQLEGITGRDVIVLPEMFTSGFAMEAAASSLAQNDVVNWMTAKAQQCNALIAGSVALQTESGSVNRFLLVEPGGTVHFYDKRHLFRMADEHLHYKAGNARVIVEWRGWRILPLVCYDLRFPVWSRNLNDYDLAIYVANWPAPRSLHWQALLTARAIENQAYVAGCNRVGSDGNGCHYRGDSRVINPQGEIIATADAHQATRIDAELSMVALREYREKFPAWQDADEFRLR
>NZ_CP029122.1|WP_000978828.1|3920195_3920645_-|hypothetical-protein
MMKYLMVLLSLFSGSVLGMGRVNELCGIDSVKTIEIINLPSYVTTLVPLSKEGLNEIYRYKVVVNEISDLYAGKIIDLLQMKYFRKEKYNNIRWGVSIISKGNNKCEIYFDAFGECGSVNGINVCFEKNEMIGWIKKEIPLLSQKIGGL
>NZ_CP029122.1|WP_001087742.1|3925557_3926910_+|membrane-protein
MNSNVLTQTIVTGSDPRGLPEFSAIREEINKASHPSQPELNWKLVESLALAIFKANGVDLHTATYYTLARTRTQGLAGFCEGAELLAAMVSHDWDKFWPQGGPARTEMLDWFNSRTGNILRQQISFAESDLPLIYRTERALQLICDKLQQVELKRVPRVENLLYFMQNTRKRLEPQLKSNTENAAQTTVRTLIYAPETQASSTPEAVVPPLPGLPEMKVEVRSLTENPPQASVIKQGSTVRGFIAGIACSVAVASALWWWQVYPVQQQLLQVNDTAQGAATVWMASPELENYERRLQQLLDTSPVQPLETGMQMMRVADSRWPESLQQQQASTQWNEALKTRAQSSPQLRGWLQTRQDLHAFADLVMQREKEGLTLSYIKNVIWQAERGLGQETPVESLLTQYHDARAQKQNTDTLEKQINERLEGVLSRWLLLKNNVMPEAATGTTAEK

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP029122_10

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP029122_10

4100634-4100749

Orphan

Consensus_repeat	Method
AACGCCTGATGCGACGCTGACGCGTCTTATC	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_CP029122_10

>merge|NZ_CP029122|10|4100634-4100749|CRISPRCasFinder
AACGCCTGATGCGACGCTGACGCGTCTTATCTGGCCTACGCGCTGTGTTTTTGTAGGCCGGATAAGCAAAGCGCATCCGGCATTCAACGCCTGATGCGACGCTGGCGCGTCTTATC

>NZ_CP029122|10|10|4100634-4100749|CRISPRCasFinder
AACGCCTGATGCGACGCTGACGCGTCTTATC	TGGCCTACGCGCTGTGTTTTTGTAGGCCGGATAAGCAAAGCGCATCCGGCATTC
AACGCCTGATGCGACGCTGGCGCGTCTTATC

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP029122.1\|WP_001148402.1\|4095333_4096098_-\|DedA-family-protein	unknown	unknown	gnl\|CDD\|223659
NZ_CP029122.1\|WP_000235700.1\|4092927_4094538_+\|thiamine/thiamine-pyrophosphate-ABC-transporter-permease-ThiP	unknown	unknown	gnl\|CDD\|181853
NZ_CP029122.1\|WP_000800453.1\|4111270_4112557_+\|peptidylprolyl-isomerase-SurA	unknown	unknown	gnl\|CDD\|236758
NZ_CP029122.1\|WP_001371424.1\|4097400_4099101_+\|ribulokinase	unknown	unknown	gnl\|CDD\|235221
NZ_CP029122.1\|WP_001065381.1\|4113542_4114364_+\|16S-rRNA-(adenine(1518)-N(6)/adenine(1519)-N(6))--dimethyltransferase-RsmA	unknown	unknown	gnl\|CDD\|234708
NZ_CP029122.1\|WP_000035637.1\|4101583_4103935_+\|DNA-polymerase-II	unknown	unknown	gnl\|CDD\|235595
NZ_CP029122.1\|WP_001117011.1\|4104099_4107006_+\|RNA-polymerase-associated-protein-RapA	unknown	unknown	gnl\|CDD\|235319
NZ_CP029122.1\|WP_000151734.1\|4099111_4100614_+\|L-arabinose-isomerase	unknown	unknown	gnl\|CDD\|179503
NZ_CP029122.1\|WP_000610901.1\|4114366_4114744_+\|Co2+/Mg2+-efflux-protein-ApaG	unknown	unknown	gnl\|CDD\|180098
NZ_CP029122.1\|WP_000888642.1\|4100813_4101509_+\|L-ribulose-5-phosphate-4-epimerase	unknown	unknown	gnl\|CDD\|236181
NZ_CP029122.1\|WP_001200579.1\|4107793_4108609_-\|co-chaperone-DjlA	unknown	unknown	gnl\|CDD\|236512
NZ_CP029122.1\|WP_001297366.1\|4090149_4091805_+\|DNA-binding-transcriptional-regulator-SgrR	unknown	unknown	gnl\|CDD\|184188
NZ_CP029122.1\|WP_000746150.1\|4108863_4111218_+\|LPS-assembly-protein-LptD	unknown	unknown	gnl\|CDD\|235158
NZ_CP029122.1\|WP_001371422.1\|4091968_4092952_+\|thiamine-ABC-transporter-substrate-binding-subunit	unknown	unknown	gnl\|CDD\|236883
NZ_CP029122.1\|WP_001300811.1\|4096183_4097062_-\|arabinose-operon-transcriptional-regulator-AraC	unknown	unknown	gnl\|CDD\|236717
NZ_CP029122.1\|WP_000916291.1\|4094521_4095220_+\|thiamine-ABC-transporter-ATP-binding-protein-ThiQ	unknown	unknown	gnl\|CDD\|182716
NZ_CP029122.1\|WP_001248770.1\|4089929_4090061_-\|glucose-uptake-inhibitor-SgrT	unknown	unknown	gnl\|CDD\|374203
NZ_CP029122.1\|WP_000241271.1\|4112556_4113546_+\|4-hydroxythreonine-4-phosphate-dehydrogenase-PdxA	unknown	unknown	gnl\|CDD\|234696
NZ_CP029122.1\|WP_000637846.1\|4088649_4089828_-\|sugar-efflux-transporter-SetA	unknown	unknown	gnl\|CDD\|129977
NZ_CP029122.1\|WP_000525176.1\|4107017_4107677_+\|bifunctional-tRNA-pseudouridine(32)-synthase/23S-rRNA-pseudouridine(746)-synthase-RluA	unknown	unknown	gnl\|CDD\|236659

Protein	Function_ID	Function_description	E-value
NZ_CP029122.1\|WP_001148402.1\|4095333_4096098_-\|DedA-family-protein	gnl\|CDD\|223659	COG0586, DedA, Uncharacterized membrane-associated protein [Function unknown].	2.3759e-49
NZ_CP029122.1\|WP_000235700.1\|4092927_4094538_+\|thiamine/thiamine-pyrophosphate-ABC-transporter-permease-ThiP	gnl\|CDD\|181853	PRK09433, thiP, thiamine transporter membrane protein; Reviewed.	0
NZ_CP029122.1\|WP_000800453.1\|4111270_4112557_+\|peptidylprolyl-isomerase-SurA	gnl\|CDD\|236758	PRK10770, PRK10770, peptidyl-prolyl cis-trans isomerase SurA; Provisional.	0
NZ_CP029122.1\|WP_001371424.1\|4097400_4099101_+\|ribulokinase	gnl\|CDD\|235221	PRK04123, PRK04123, ribulokinase; Provisional.	0
NZ_CP029122.1\|WP_001065381.1\|4113542_4114364_+\|16S-rRNA-(adenine(1518)-N(6)/adenine(1519)-N(6))--dimethyltransferase-RsmA	gnl\|CDD\|234708	PRK00274, ksgA, 16S rRNA (adenine(1518)-N(6)/adenine(1519)-N(6))-dimethyltransferase RsmA.	2.76119e-148
NZ_CP029122.1\|WP_000035637.1\|4101583_4103935_+\|DNA-polymerase-II	gnl\|CDD\|235595	PRK05762, PRK05762, DNA polymerase II; Reviewed.	0
NZ_CP029122.1\|WP_001117011.1\|4104099_4107006_+\|RNA-polymerase-associated-protein-RapA	gnl\|CDD\|235319	PRK04914, PRK04914, RNA polymerase-associated protein RapA.	0
NZ_CP029122.1\|WP_000151734.1\|4099111_4100614_+\|L-arabinose-isomerase	gnl\|CDD\|179503	PRK02929, PRK02929, L-arabinose isomerase; Provisional.	0
NZ_CP029122.1\|WP_000610901.1\|4114366_4114744_+\|Co2+/Mg2+-efflux-protein-ApaG	gnl\|CDD\|180098	PRK05461, apaG, CO2+/MG2+ efflux protein ApaG; Reviewed.	3.63315e-76
NZ_CP029122.1\|WP_000888642.1\|4100813_4101509_+\|L-ribulose-5-phosphate-4-epimerase	gnl\|CDD\|236181	PRK08193, araD, L-ribulose-5-phosphate 4-epimerase AraD.	1.31794e-177
NZ_CP029122.1\|WP_001200579.1\|4107793_4108609_-\|co-chaperone-DjlA	gnl\|CDD\|236512	PRK09430, djlA, co-chaperone DjlA.	2.49529e-169
NZ_CP029122.1\|WP_001297366.1\|4090149_4091805_+\|DNA-binding-transcriptional-regulator-SgrR	gnl\|CDD\|184188	PRK13626, PRK13626, HTH-type transcriptional regulator SgrR.	0
NZ_CP029122.1\|WP_000746150.1\|4108863_4111218_+\|LPS-assembly-protein-LptD	gnl\|CDD\|235158	PRK03761, PRK03761, LPS assembly outer membrane complex protein LptD; Provisional.	0
NZ_CP029122.1\|WP_001371422.1\|4091968_4092952_+\|thiamine-ABC-transporter-substrate-binding-subunit	gnl\|CDD\|236883	PRK11205, tbpA, thiamine transporter substrate binding subunit; Provisional.	0
NZ_CP029122.1\|WP_001300811.1\|4096183_4097062_-\|arabinose-operon-transcriptional-regulator-AraC	gnl\|CDD\|236717	PRK10572, PRK10572, arabinose operon transcriptional regulator AraC.	0
NZ_CP029122.1\|WP_000916291.1\|4094521_4095220_+\|thiamine-ABC-transporter-ATP-binding-protein-ThiQ	gnl\|CDD\|182716	PRK10771, thiQ, thiamine ABC transporter ATP-binding protein ThiQ.	1.49788e-164
NZ_CP029122.1\|WP_001248770.1\|4089929_4090061_-\|glucose-uptake-inhibitor-SgrT	gnl\|CDD\|374203	pfam15894, SgrT, Inhibitor of glucose uptake transporter SgrT.	0.00206924
NZ_CP029122.1\|WP_000241271.1\|4112556_4113546_+\|4-hydroxythreonine-4-phosphate-dehydrogenase-PdxA	gnl\|CDD\|234696	PRK00232, pdxA, 4-hydroxythreonine-4-phosphate dehydrogenase; Reviewed.	0
NZ_CP029122.1\|WP_000637846.1\|4088649_4089828_-\|sugar-efflux-transporter-SetA	gnl\|CDD\|129977	TIGR00899, Sugar_efflux_transporter_A, sugar efflux transporter. This family of proteins is an efflux system for lactose, glucose, aromatic glucosides and galactosides, cellobiose, maltose, a-methyl glucoside and other sugar compounds. They are found in both gram-negative and gram-postitive bacteria. [Transport and binding proteins, Carbohydrates, organic alcohols, and acids].	0
NZ_CP029122.1\|WP_000525176.1\|4107017_4107677_+\|bifunctional-tRNA-pseudouridine(32)-synthase/23S-rRNA-pseudouridine(746)-synthase-RluA	gnl\|CDD\|236659	PRK10158, PRK10158, bifunctional tRNA pseudouridine(32) synthase/23S rRNA pseudouridine(746) synthase RluA.	1.37214e-159

>NZ_CP029122.1|WP_000151734.1|4099111_4100614_+|L-arabinose-isomerase
MTIFDNYEVWFVIGSQHLYGPETLRQVTQHAEHVVNALNTEAKLPCKLVLKPLGTTPDEITAICRDANYDDRCAGLVVWLHTFSPAKMWINGLTMLNKPLLQFHTQFNAALPWDSIDMDFMNLNQTAHGGREFGFIGARMRQQHAVVTGHWQDKQAHERIGSWMRQAVSKQDTRHLKVCRFGDNMREVAVTDGDKVAAQIKFGFSVNTWAVGDLVQVVNSISDGDVNALVDEYESCYTMTPATQIHGEKRQNVLEAARIELGMKRFLEQGGFHAFTTTFEDLHGLKQLPGLAVQRLMQQGYGFAGEGDWKTAALLRIMKVMSTGLQGGTSFMEDYTYHFEKGNDLVLGSHMLEVCPSIAVEEKPILDVQHLGIGGKDDPARLIFNTQTGPAIVASLIDLGDRYRLLVNCIDTVKTPHSLPKLPVANALWKAQPDLPTASEAWILAGGAHHTVFSHALNLNDMRQFAEMHDIEITVIDNDTRLPAFKDALRWNEVYYGFRR
>NZ_CP029122.1|WP_001371424.1|4097400_4099101_+|ribulokinase
MAIAIGLDFGSDSVRALAVDCASGEEIATSVEWYPRWQKGQFCDAPNNQFRHHPRDYIESMEAALKTVLAELSVEQRAAVVGIGVDTTGSTPAPIDADGNVLALRPEFAENPNAMFVLWKDHTAVEEAEEITRLCHAPGNVDYSRYIGGIYSSEWFWAKILHVTRQDSAVAQSAASWIELCDWVPALLSGTTGPQDIRRGRCSAGHKSLWHESWGGLPPASFFDELDPILNRHLPSPLFTDTWTADIPVGTLCPEWAQRLGLPESVVISGGAFDCHMGAVGAGAQPNALVKVIGTSTCDILIADKQSVGERAVKGICGQVDGSVVPGFIGLEAGQSAFGDIYAWFGRVLGWPLEQLAAQHPELKAQINASQKQLLPALTEAWAKNPSLDHLPVVLDWFNGRRTPNANQRLKGVITDLNLATDAPLLFGGLIAATAFGARAIMECFTDQGIAVNNVMALGGIARKNQVIMQACCDVLNRPLQIVASDQCCALGAAIFAAVAAKVHADIPSAQQKMASAVEKTLQPCSEQAQRFEQLYRRYQQWAMSAEQHYLPTSAPAQAAQAVPTL
>NZ_CP029122.1|WP_001300811.1|4096183_4097062_-|arabinose-operon-transcriptional-regulator-AraC
MAEAQNDPLLPGYSFNAHLVAGLTPIEANGYLDFFIDRPLGMKGYILNLTIRGQGVVKNQGREFVCRPGDILLFPPGEIHHYGRHPEAREWYHQWVYFRPRAYWHEWLNWPSIFANTGFFRPDEAHQPHFSDLFGQIINAGQGEGRYSELLAINLLEQLLLRRMEAINESLHPPMDNRVREACQYISDHLADSNFDIASVAQHVCLSPSRLSHLFRQQLGISVLSWREDQRISQAKLLLSTTRMPIATVGRNVGFDDQLYFSRVFKKCTGASPSEFRAGCEEKVNDVAVKLS
>NZ_CP029122.1|WP_001148402.1|4095333_4096098_-|DedA-family-protein
MQALLEHFITQSTVYSLMAVVLVAFLESLALVGLILPGTVLMAGLGALIGSGELSFWHAWLAGIVGCLLGDWISFWLGWRFKKPLHRWSFLKKNKALLDKTEHALHQHSMFTILVGRFVGPTRPLVPMVAGMLDLPVAKFITPNIIGCLLWPPFYFLPGILAGAAIDIPAGMQSGEFKWLLLATAVFLWVGGWLCWRLWRSGKATDRLSHYLSRGRLLWLTPLISAIGVVALVVLIRHPLMPVYIDILRKVVGG
>NZ_CP029122.1|WP_000916291.1|4094521_4095220_+|thiamine-ABC-transporter-ATP-binding-protein-ThiQ
MLKLTDITWLYHHLPMRFSLTVERGEQVAILGPSGAGKSTLLNLIAGFLTPASGSLTIDGVDHTTTPPSRRPVSMLFQENNLFSHLTVAQNIGLGLNPGLKLNAAQQEKMHAIARQMGIDNLMARLPGELSGGQRQRVALARCLVREQPILLLDEPFSALDPALRQEMLTLVSTSCQQQKMTLLMVSHSVEDAARIATRSVVVADGRIAWQGKTNELLSGKASASALLGITG
>NZ_CP029122.1|WP_000235700.1|4092927_4094538_+|thiamine/thiamine-pyrophosphate-ABC-transporter-permease-ThiP
MATRRQPLIPGWLIPGVSAATLVVAVALAAFLALWWNAPQGNWVAVWQDSYLWHVVRFSFWQAFLSALLSVVPAIFLARALYRRRFPGRLALLRLCAMTLILPVLVAVFGILSVYGRQGWLASLCQSLGLEWTFSPYGLQGILLAHVFFNLPMASRLLLQALENIPGEQRQLAAQLGMRGWHFFRFVEWPWLRRQIPPVAALIFMLCFASFATVLSLGGGPQATTIELAIYQALSYDYDPARAAMLALIQMVCCLGLVLLSQRLSKAIAPGTTLLQGWRDPDDRLHSRICDTVLIVLALLLLLPPLLAVIVDGVNRQLPEVLAQPVLWQALWTSLRIALAAGVLCVVLTMMLLWSSRELRARQKMLAGQALEMSGMLILAMPGIVLATGFFLLLNNTIGLPQSADGIVIFTNALMAIPYALKVLENPMRDITARYSMLCQSLGIEGWSRLKVVELRALKRPLAQALAFACVLSIGDFGVVALFGNDDFRTLPFYLYQQIGSYRSQDGAVTALILLLLCFLLFTVIEKLPGRNVKTD
>NZ_CP029122.1|WP_001371422.1|4091968_4092952_+|thiamine-ABC-transporter-substrate-binding-subunit
MLKKCLPLLLLCTAPVFAKPVLIVYTYDSFAADWGPGPKIKKAFEADCNCELKLVALEDGVSLLNRLRMEGKNSKADVVLGLDNNLLDAASKTGLFAKSGVAADAVNVPGGWNNDTFVPFDYGYFAFVYDKNKLKNPPQSLKELVESDQNWRVIYQDPRTSTPGLGLLLWMQKVYGDDAPQAWQKLAKKTVTVTKGWSEAYGLFLKGESDLVLSYTTSPAYHILEEKKDNYAAANFSEGHYLQVEVAARTAASKQPELAQKFLQFMVSPAFQNAIPTGNWMYPVANVTLPAGFEQLTKPATTLEFTPAEVAAQRQAWISEWQRAVSR
>NZ_CP029122.1|WP_001297366.1|4090149_4091805_+|DNA-binding-transcriptional-regulator-SgrR
MPSARLQQQFIRLWQCCEGKSQDTTLNELAALLSCSRRHMRTLLNTMQDRGWLTWEAEVGRGKRSRLTFLYTGLALQQQRAEDLLEQDRIDQLVQLVGDKATVRQMLVSHLGRSFRQGRHILRVLYYRPLRNLLPGSALRRSETHIARQIFSSLTRINEENGELEADIAHHWQQISPLHWRFFLRPGVHFHHGRELEMDDVIASLKRINTLPLYSHIADIVSPTPWTLDIHLTQPDRWLPLLLGQVPAMILPREWETLSNFASHPIGTGPYAVIRNTTNQLKIQAFDDFFGYRALIDEVNVWVLPEIADEPAGGLMLKGPQGEEKEIESRLEEGCYYLLFDSRTHRGANQQVRDWVSYVLSPTNLVYFAEEQYQQLWFPAYGLLPRWHHARTIKSEKPAGLESLTLTFYQDHSEHRVIAGIMQQILASHQVTLEIKEISYDQWHEGEIESDIWLNSANFTLPLDFSLFAHLCEVPLLQHCIPIDWQADAARWRNGEMNLANWCQQLVASKAMVPLIHHWLIIQGQRSMRGLRMNTLGWFDFKSAWFAPPDP
>NZ_CP029122.1|WP_001248770.1|4089929_4090061_-|glucose-uptake-inhibitor-SgrT
MRQFYQHYFTATAKLCWLRWLSVPQRLTMLEGLMQWDDRNSES
>NZ_CP029122.1|WP_000637846.1|4088649_4089828_-|sugar-efflux-transporter-SetA
MIWIMTMARRMNGVYAAFMLVAFMMGVAGALQAPTLSLFLSREVGAQPFWIGLFYTVNAIAGIGVSLWLAKRSDSQGDRRKLIIFCCLMAIGNALLFAFNRHYLTLITCGVLLASLANTAMPQLFALAREYADNSAREVVMFSSVMRAQLSLAWVIGPPLAFMLALNYGFTVMFSIAAGIFTLSLVLIAFMLPSVARVELPSENALSMQGGWQDSNVRMLFVASTLMWTCNTMYIIDMPLWISSELGLPDKLAGFLMGTAAGLEIPAMILAGYYVKRYGKRRMMVIAVAAGVLFYTGLIFFHSRMALMTLQLFNAVFIGIVAGIGMLWFQDLMPGRAGAATTLFTNSISTGVILAGVIQGAIAQSWGHFAVYWVIAVISVVALFLTAKVKDV
>NZ_CP029122.1|WP_000888642.1|4100813_4101509_+|L-ribulose-5-phosphate-4-epimerase
MLEDLKRLVLEANLALPKHNLVTLTWGNVSAVDRERGVFVIKPSGVDYSVMTADDMVVVSIATGEVVEGTKKPSSDTPTHRLLYQAFPSIGGIVHTHSRHATIWAQAGQSIPATGTTHADYFYGTIPCTRKMTDAEINGEYEWETGNVIVETFEKQGIDAAQMPGVLVHSHGPFAWGKNAEDAVHNAIVLEEVAYMGIFCRQLAPQLPDMQQTLLDKHYLRKHGAKAYYGQ
>NZ_CP029122.1|WP_000035637.1|4101583_4103935_+|DNA-polymerase-II
MAQAGFILTRHWRDTPQGTEVSFWLATDNGPLQVTLAPQESVAFIPADQVPRAQHILQGEQGFRLTPLALKDFHRQPVYGLYCRAHRQLMNYEKRLREGGVTVYEADVRPPERYLMERFITSPVWVEGDIRNGAIVNARLKPHPDYRPPLKWVSIDIETTRHGELYCIGLEGCGQRIVYMLGPENGDASALDFELEYVASRPQLLEKLNAWFANYDPDVIIGWNVVQFDLRMLQKHAERYRIPLRLGRDNSELEWREHGFKNGVFFAQAKGRLIIDGIEALKSAFWNFSSFSLETVAQELLGEGKSIDNPWDRMDEIDRRFAEDKPALATYNLKDCELVTQIFHKTEIMPFLLERATVNGLPVDRHGGSVAAFGHLYFPRMHRAGYVAPNLGEVPPHASPGGYVMDSRPGLYDSVLVLDYKSLYPSIIRTFLIDPVGLVEGMAQPDPEHSTEGFLDAWFSREKHCLPEIVTNIWHGRDEAKRQGNKPLSQALKIIMNAFYGVLGTTACRFFDPRLASSITMRGHQIMRQTKALIEAQGYDVIYGDTDSTFVWLKGAHSEEEAAKIGRALVQHVNAWWAETLQKQRLTSALELEYETHFCRFLMPTIRGADTGSKKRYAGLIQEGDKQRMVFKGLETVRTDWTPLAQQFQQELYLRIFRNEPYQEYIRETIDKLMAGELDARLVYRKRLRRPLSEYQRNVPPHVRAARLADEENQKRGRPLQYQNRGTIKYVWTTNGPEPLDYQRSPLDYEHYLTRQLQPVAEGILPFIEDNFATLMTGQLGLF
>NZ_CP029122.1|WP_001117011.1|4104099_4107006_+|RNA-polymerase-associated-protein-RapA
MPFTLGQRWISDTESELGLGTVVAVDARTVTLLFPSTGENRLYARSDSPVTRVMFNPGDTITSHDGWQMQVEEVKEENGLLTYIGTRLDTEESGVALREVFLDSKLVFSKPQDRLFAGQIDRMDRFALRYRARKYSSEQFRMPYSGLRGQRTSLIPHQLNIAHDVGRRHAPRVLLADEVGLGKTIEAGMILHQQLLSGAAERVLIIVPETLQHQWLVEMLRRFNLRFALFDDERYAEAQHDAYNPFDTEQLVICSLDFARRSKQRLEHLCEAEWDLLVVDEAHHLVWSEDAPSREYQAIEQLAEHVPGVLLLTATPEQLGMESHFARLRLLDPNRFHDFAQFVEEQKNYRPVADAVAMLLAGNKLSNDELNMLGEMIGEQDIEPLLQAANSDSEDAQSARQELVSMLMDRHGTSRVLFRNTRNGVKGFPKRELHTIKLPLPTQYQTAIKVSGIMGARKSAEDRARDMLYPERIYQEFEGDNATWWNFDPRVEWLMGYLTSHRSQKVLVICAKAATALQLEQVLREREGIRAAVFHEGMSIIERDRAAAWFAEEDTGAQVLLCSEIGSEGRNFQFASHMVMFDLPFNPDLLEQRIGRLDRIGQAHDIQIHVPYLEKTAQSVLVRWYHEGLDAFEHTCPTGRTIYDSVYNDLINYLASPDQTEGFDDLIKNCREQHEALKAQLEQGRDRLLEIHSNGGEKAQALAESIEEQDDDTNLIAFAMNLFDIIGINQDDRGDNMIVLTPSDHMLVPDFPGLSEDGITITFDREVALAREDAQFITWEHPLIRNGLDLILSGDTGSSTISLLKNKALPVGTLLVELIYVVEAQAPKQLQLNRFLPPTPVRMLLDKNGNNLAAQVEFETFNRQLNAVNRHTGSKLVNAVQQDVHAILQLGEAQIEKSARALIDAARNEADEKLSAELSRLEALRAVNPNIRDDELTAIESNRQQVMESLDQAGWRLDALRLIVVTHQ
>NZ_CP029122.1|WP_000525176.1|4107017_4107677_+|bifunctional-tRNA-pseudouridine(32)-synthase/23S-rRNA-pseudouridine(746)-synthase-RluA
MGMENYNPPQEPWLVILYQDDHIMVVNKPSGLLSVPGRLEEHKDSVMTRIQRDYPQAESVHRLDMATSGVIVVALTKAAERELKRQFREREPKKQYVARVWGHPSPAEGLVDLPLICDWPNRPKQKVCYETGKPAQTEYEVVEYAADNTARVVLKPITGRSHQLRVHMLALGHPILGDRFYASPEARAMAPRLLLHAEMLTITHPAYGNSMTFKAPADF
>NZ_CP029122.1|WP_001200579.1|4107793_4108609_-|co-chaperone-DjlA
MQYWGKIIGVAVALLMGGGFWGVVLGLLIGHMFDKARSRKMAWFANQRERQALFFATTFEVMGHLTKSKGRVTEADIHIASQLMDRMNLHGASRTAAQNAFRVGKSDNYPLREKMRQFRSVCFGRFDLIRMFLEIQIQAAFADGSLHPNERAVLYVIAEELGISRAQFDQFLRMMQGGAQFGGGYQQQTGGGNWQQAQRGPTLEDACNVLGVKPTDDATTIKRAYRKLMSEHHPDKLVAKGLPPEMMEMAKQKAQEIQQAYELIKQQKGFK
>NZ_CP029122.1|WP_000746150.1|4108863_4111218_+|LPS-assembly-protein-LptD
MKKRIPTLLATMIATALYSQQGLAADLASQCMLGVPSYDRPLVQGDTNDLPVTINADHAKGDYPDDAVFTGSVDIMQGNSRLQADEVQLHQKEAPGQPEPVRTVDALGNVHYDDNQVILKGPKGWANLNTKDTNVWEGDYQMVGRQGRGKADLMKQRGENRYTILDNGSFTSCLPGSDTWSVVGSEIIHDREEQVAEIWNARFKVGPVPIFYSPYLQLPVGDKRRSGFLIPNAKYTTTNYFEFYLPYYWNIAPNMDATITPHYMHRRGNIMWENEFRYLSQAGAGLMELDYLPSDKVYEDEHPNDDSSRRWLFYWNHSGVMDQVWRFNVDYTKVSDPSYFNDFDNKYGSSTDGYATQKFSVGYAVQNFNATVSTKQFQVFSEQNTSSYSAEPQLDVNYYQNDVGPFDTRIYGQAVHFVNTRDDMPEATRVHLEPTINLPLSNNWGSINTEAKLLATHYQQTNLDWYNSRNTTKLDESVNRVMPQFKVDGKMVFERDMEMLAPGYTQTLEPRAQYLYVPYRDQSDIYNYDSSLLQSDYSGLFRDRTYGGLDRIASANQVTTGVTSRIYDDAAVERFNISVGQIYYFTESRTGDDNITWENDDKTGSLVWAGDTYWRISERWGLRGGIQYDTRLDNVATSNSSIEYRRDEDRLVQLNYRYASPEYIQATLPKYYSTAEQYKNGISQVGAVASWPIADRWSIVGAYYYDTNANKQADSMLGVQYSSCCYAIRVGYERKLNGWDNDKQHAVYDNAIGFNIELRGLSSNYGLGTQEMLRSNILPYQNSL
>NZ_CP029122.1|WP_000800453.1|4111270_4112557_+|peptidylprolyl-isomerase-SurA
MKNWKTLLLGIAMIANTSFAAPQVVDKVAAVVNNGVVLESDVDGLMQSVKLNAAQARQQLPDDATLRHQIMERLIMDQIILQMGQKMGVKISDEQLDQAIANIAKQNNMTLDQMRSRLAYDGLNYNTYRNQIRKEMIISEVRNNEVRRRITILPQEVESLAQQVGNQNDASTELNLSHILIPLPENPTSDQVNEAESQARAIVDQARNGADFGKLAIAHSADQQALNGGQMGWGRIQELPGIFAQALSTAKKGDIVGPIRSGVGFHILKVNDLRGESKNISVTEVHARHILLKPSPIMTDEQARVKLEQIAADIKSGKTTFAAAAKEFSQDPGSANQGGDLGWATADIFDPAFRDALTRLNKGQMSAPVHSSFGWHLIELLDTRNVDKTDAAQKDRAYRMLMNRKFSEEAASWMQEQRASAYVKILSN
>NZ_CP029122.1|WP_000241271.1|4112556_4113546_+|4-hydroxythreonine-4-phosphate-dehydrogenase-PdxA
MVKTQRVVITPGEPAGIGPDLVVQLAQREWPVELVVCADATLLTDRAAMLGLPLTLRTYSPNSPAQPQTAGTLTLLPVALRESVTAGQLAVENGHYVVETLARACDGCLNGEFAALITGPVHKGVINDAGIPFTGHTEFFEERSQAKKVVMMLATEELRVALATTHLPLRDIADAITPALLHEVIAILHHDLRTKFGIAEPRILVCGLNPHAGEGGHMGTEEIDTIIPLLDELRAQGMKLNGPLPADTLFQPKYLDNADAVLAMYHDQGLPVLKYQGFGRGVNITLGLPFIRTSVDHGTALELAGRGEADVGSFITALNLAIKMIVNTQ
>NZ_CP029122.1|WP_001065381.1|4113542_4114364_+|16S-rRNA-(adenine(1518)-N(6)/adenine(1519)-N(6))--dimethyltransferase-RsmA
MNNRVHQGHLARKRFGQNFLNDQFVIDSIVSAINPQKGQAMVEIGPGLAALTEPVGERLDQLTVIELDRDLAARLQTHPFLGPKLTIYQQDAMTFNFGELAEKMGQPLRVFGNLPYNISTPLMFHLFSYTDAIADMHFMLQKEVVNRLVAGPNSKAYGRLSVMAQYYCNVIPVLEVPPSAFTPPPKVDSAVVRLVPHATMPHPVKDVRVLSRITTEAFNQRRKTIRNSLGNLFSVEVLTGMGIDPAMRAENISVAQYCQMANYLAENAPLQES
>NZ_CP029122.1|WP_000610901.1|4114366_4114744_+|Co2+/Mg2+-efflux-protein-ApaG
MINSPRVCIQVQSVYIEAQSSPDNERYVFAYTVTIRNLGRAPVQLLGRYWLITNGNGRETEVQGEGVVGVQPLIAPGEEYQYTSGAIIETPLGTMQGHYEMIDENGVPFSIDIPVFRLAVPTLIH

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP029122_11

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP029122_11

4123662-4123794

Orphan

Consensus_repeat	Method
ATCACCAATATTGAAAA	PILER-CR

2 spacers

The CRISPR arrays of NZ_CP029122_11

>merge|NZ_CP029122|11|4123662-4123794|PILER-CR
ATCACCAATATTGAAAATGTCACACGCAGATAAATCCAACTTTCAATATTGTTAAGTTCCTCACCAATATTGAAAACATGGCGTAGCAAAAAGAAATTTTCAATATTGCTTTATGGATCACCAATATTGAAAG

>NZ_CP029122|11|3|4123662-4123794|PILER-CR
ATCACCAATATTGAAAA	TGTCACACGCAGATAAATCCAACTTTCAATATTGTTAAGTTC
CTCACCAATATTGAAAA	CATGGCGTAGCAAAAAGAAATTTTCAATATTGCTTTATGG
ATCACCAATATTGAAAG

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP029122.1\|WP_000004404.1\|4129813_4130599_+\|crotonobetainyl-CoA-hydratase	unknown	unknown	gnl\|CDD\|179599
NZ_CP029122.1\|WP_001091499.1\|4121844_4122786_-\|electron-transfer-flavoprotein-subunit-alpha/FixB-family-protein	unknown	unknown	gnl\|CDD\|235120
NZ_CP029122.1\|WP_000351348.1\|4128151_4129705_+\|crotonobetaine/carnitine-CoA-ligase	unknown	unknown	gnl\|CDD\|181195
NZ_CP029122.1\|WP_000377129.1\|4116341_4118204_-\|glutathione-regulated-potassium-efflux-system-protein-KefC	unknown	unknown	gnl\|CDD\|235131
NZ_CP029122.1\|WP_000597260.1\|4135175_4136324_-\|glutamine-hydrolyzing-carbamoyl-phosphate-synthase-small-subunit	unknown	unknown	gnl\|CDD\|237139
NZ_CP029122.1\|WP_000543597.1\|4136779_4137601_-\|4-hydroxy-tetrahydrodipicolinate-reductase	unknown	unknown	gnl\|CDD\|223366
NZ_CP029122.1\|WP_000333120.1\|4131280_4131676_-\|carnitine-metabolism-transcriptional-regulator-CaiF	unknown	unknown	gnl\|CDD\|183154
NZ_CP029122.1\|WP_000122876.1\|4130604_4131195_+\|carnitine-operon-protein-CaiE	unknown	unknown	gnl\|CDD\|184189
NZ_CP029122.1\|WP_000610901.1\|4114366_4114744_+\|Co2+/Mg2+-efflux-protein-ApaG	unknown	unknown	gnl\|CDD\|180098
NZ_CP029122.1\|WP_001287715.1\|4120507_4121794_-\|FAD-dependent-oxidoreductase	unknown	unknown	gnl\|CDD\|182273
NZ_CP029122.1\|WP_000203747.1\|4120223_4120511_-\|ferredoxin-like-protein-FixX	unknown	unknown	gnl\|CDD\|185346
NZ_CP029122.1\|WP_001183198.1\|4118834_4120166_-\|MFS-transporter	unknown	unknown	gnl\|CDD\|340874
NZ_CP029122.1\|WP_000347117.1\|4125589_4126732_+\|crotonobetainyl-CoA-dehydrogenase	unknown	unknown	gnl\|CDD\|179566
NZ_CP029122.1\|WP_001126376.1\|4131936_4135158_-\|carbamoyl-phosphate-synthase-large-subunit	unknown	unknown	gnl\|CDD\|235393
NZ_CP029122.1\|WP_000349926.1\|4126860_4128078_+\|L-carnitine-CoA-transferase	unknown	unknown	gnl\|CDD\|179589
NZ_CP029122.1\|WP_000600725.1\|4118196_4118727_-\|glutathione-regulated-potassium-efflux-system-oxidoreductase-KefF	unknown	unknown	gnl\|CDD\|234852
NZ_CP029122.1\|WP_000624375.1\|4115670_4116150_-\|type-3-dihydrofolate-reductase	unknown	unknown	gnl\|CDD\|182714
NZ_CP029122.1\|WP_000257192.1\|4114750_4115593_+\|bis(5'-nucleosyl)-tetraphosphatase-(symmetrical)	unknown	unknown	gnl\|CDD\|273208
NZ_CP029122.1\|WP_000692204.1\|4122800_4123571_-\|electron-transfer-flavoprotein-FixA	unknown	unknown	gnl\|CDD\|179569
NZ_CP029122.1\|WP_000787103.1\|4124044_4125559_+\|L-carnitine/gamma-butyrobetaine-antiport-BCCT-transporter	unknown	unknown	gnl\|CDD\|179568

Protein	Function_ID	Function_description	E-value
NZ_CP029122.1\|WP_000004404.1\|4129813_4130599_+\|crotonobetainyl-CoA-hydratase	gnl\|CDD\|179599	PRK03580, PRK03580, crotonobetainyl-CoA hydratase.	1.76707e-178
NZ_CP029122.1\|WP_001091499.1\|4121844_4122786_-\|electron-transfer-flavoprotein-subunit-alpha/FixB-family-protein	gnl\|CDD\|235120	PRK03363, fixB, electron transfer flavoprotein subunit alpha/FixB family protein.	0
NZ_CP029122.1\|WP_000351348.1\|4128151_4129705_+\|crotonobetaine/carnitine-CoA-ligase	gnl\|CDD\|181195	PRK08008, caiC, putative crotonobetaine/carnitine-CoA ligase; Validated.	0
NZ_CP029122.1\|WP_000377129.1\|4116341_4118204_-\|glutathione-regulated-potassium-efflux-system-protein-KefC	gnl\|CDD\|235131	PRK03562, PRK03562, glutathione-regulated potassium-efflux system protein KefC; Provisional.	0
NZ_CP029122.1\|WP_000597260.1\|4135175_4136324_-\|glutamine-hydrolyzing-carbamoyl-phosphate-synthase-small-subunit	gnl\|CDD\|237139	PRK12564, PRK12564, carbamoyl-phosphate synthase small subunit.	0
NZ_CP029122.1\|WP_000543597.1\|4136779_4137601_-\|4-hydroxy-tetrahydrodipicolinate-reductase	gnl\|CDD\|223366	COG0289, DapB, Dihydrodipicolinate reductase [Amino acid transport and metabolism].	9.17052e-141
NZ_CP029122.1\|WP_000333120.1\|4131280_4131676_-\|carnitine-metabolism-transcriptional-regulator-CaiF	gnl\|CDD\|183154	PRK11476, PRK11476, carnitine metabolism transcriptional regulator CaiF.	2.96175e-74
NZ_CP029122.1\|WP_000122876.1\|4130604_4131195_+\|carnitine-operon-protein-CaiE	gnl\|CDD\|184189	PRK13627, PRK13627, carnitine operon protein CaiE; Provisional.	2.12106e-142
NZ_CP029122.1\|WP_000610901.1\|4114366_4114744_+\|Co2+/Mg2+-efflux-protein-ApaG	gnl\|CDD\|180098	PRK05461, apaG, CO2+/MG2+ efflux protein ApaG; Reviewed.	3.63315e-76
NZ_CP029122.1\|WP_001287715.1\|4120507_4121794_-\|FAD-dependent-oxidoreductase	gnl\|CDD\|182273	PRK10157, PRK10157, putative oxidoreductase FixC; Provisional.	0
NZ_CP029122.1\|WP_000203747.1\|4120223_4120511_-\|ferredoxin-like-protein-FixX	gnl\|CDD\|185346	PRK15449, PRK15449, ferredoxin-like protein FixX; Provisional.	2.23442e-69
NZ_CP029122.1\|WP_001183198.1\|4118834_4120166_-\|MFS-transporter	gnl\|CDD\|340874	cd17316, MFS_SV2_like, Metazoan Synaptic vesicle glycoprotein 2 (SV2) and related small molecule transporters of the Major Facilitator Superfamily. This family is composed of metazoan synaptic vesicle glycoprotein 2 (SV2) and related small molecule transporters including those that transport inorganic phosphate (Pht), aromatic compounds (PcaK and related proteins), proline/betaine (ProP), alpha-ketoglutarate (KgtP), citrate (CitA), shikimate (ShiA), and cis,cis-muconate (MucK), among others. SV2 is a transporter-like protein that serves as the receptor for botulinum neurotoxin A (BoNT/A), one of seven neurotoxins produced by the bacterium Clostridium botulinum. BoNT/A blocks neurotransmitter release by cleaving synaptosome-associated protein of 25 kD (SNAP-25) within presynaptic nerve terminals. Also included in this family is synaptic vesicle 2 (SV2)-related protein (SVOP) and similar proteins. SVOP is a transporter-like nucleotide binding protein that localizes to neurotransmitter-containing vesicles. The SV2-like family belongs to the Major Facilitator Superfamily (MFS) of membrane transport proteins, which are thought to function through a single substrate binding site, alternating-access mechanism involving a rocker-switch type of movement.	5.4298e-59
NZ_CP029122.1\|WP_000347117.1\|4125589_4126732_+\|crotonobetainyl-CoA-dehydrogenase	gnl\|CDD\|179566	PRK03354, PRK03354, crotonobetainyl-CoA dehydrogenase; Validated.	0
NZ_CP029122.1\|WP_001126376.1\|4131936_4135158_-\|carbamoyl-phosphate-synthase-large-subunit	gnl\|CDD\|235393	PRK05294, carB, carbamoyl-phosphate synthase large subunit.	0
NZ_CP029122.1\|WP_000349926.1\|4126860_4128078_+\|L-carnitine-CoA-transferase	gnl\|CDD\|179589	PRK03525, PRK03525, L-carnitine CoA-transferase.	0
NZ_CP029122.1\|WP_000600725.1\|4118196_4118727_-\|glutathione-regulated-potassium-efflux-system-oxidoreductase-KefF	gnl\|CDD\|234852	PRK00871, PRK00871, glutathione-regulated potassium-efflux system oxidoreductase KefF.	2.99389e-133
NZ_CP029122.1\|WP_000624375.1\|4115670_4116150_-\|type-3-dihydrofolate-reductase	gnl\|CDD\|182714	PRK10769, folA, type 3 dihydrofolate reductase.	1.07206e-127
NZ_CP029122.1\|WP_000257192.1\|4114750_4115593_+\|bis(5'-nucleosyl)-tetraphosphatase-(symmetrical)	gnl\|CDD\|273208	TIGR00668, Bis5'-nucleosyl-tetraphosphatase_symmetrical, bis(5'-nucleosyl)-tetraphosphatase (symmetrical). Diadenosine 5',5"'-P1,P4-tetraphosphate (Ap4A) is a regulatory metabolite of stress conditions. It is hydrolyzed to two ADP by this enzyme. Alternate names include diadenosine-tetraphosphatase and Ap4A hydrolase. [Cellular processes, Adaptations to atypical conditions].	0
NZ_CP029122.1\|WP_000692204.1\|4122800_4123571_-\|electron-transfer-flavoprotein-FixA	gnl\|CDD\|179569	PRK03359, PRK03359, putative electron transfer flavoprotein FixA; Reviewed.	6.8619e-170
NZ_CP029122.1\|WP_000787103.1\|4124044_4125559_+\|L-carnitine/gamma-butyrobetaine-antiport-BCCT-transporter	gnl\|CDD\|179568	PRK03356, PRK03356, L-carnitine/gamma-butyrobetaine antiport BCCT transporter.	0

>NZ_CP029122.1|WP_000692204.1|4122800_4123571_-|electron-transfer-flavoprotein-FixA
MKIITCYKCVPDEQDIAVNNADGSLDFSKADAKISQYDLNAIEAACQLKQQAAEAQVTALSVGGKALTNAKGRKDVLSRGPDELIVVIDDQFEQALPQQTASALAAAAQKAGFDLILCGDGSSDLYAQQVGLLVGEILNIPAVNGVSKIISLTADTLTVERELEDETETLSIPLPAVVAVSTDINSPQIPSMKAILGAAKKPVQVWSAADIGFNAEAAWSEQQVAAPKQRERQRIVIEGDGEEQIAAFAENLRKVI
>NZ_CP029122.1|WP_001091499.1|4121844_4122786_-|electron-transfer-flavoprotein-subunit-alpha/FixB-family-protein
MNTFSQVWVFSDTPSRLPELMNGAQALANQINTFVLNDADGAQAIQLGANHVWKLNGKPDDRMIEDYAGVMADTIRQHGADGLVLLPNTRRGKLLAAKLGYRLKAAVSNDASTVSVQDGKATVKHMVYGGLAIGEERIATPYAVLTISSGTFDAAQPDASRTGETHTVEWQAPAVAITRTATQARQSNSVDLDKARLVVSVGRGIGSKENIALAEQLCKAIGAELACSRPVAENEKWMEHERYVGISNLMLKPELYLAVGISGQIQHMVGANASQTIFAINKDKNAPIFQYADYGIVGDAVKILPALTAALAR
>NZ_CP029122.1|WP_001287715.1|4120507_4121794_-|FAD-dependent-oxidoreductase
MSEDIFDAIIVGAGLAGSVAALVLAREGAQVLVIERGNSAGAKNVTGGRLYAHSLEHIIPGFADSAPVERLITHEKLAFMTEKSAMTMDYCNGDETSPSQRSYSVLRSKFDAWLMEQAEEAGAQLITGIRVDNLVQRDGKVVGVEADGDVIEAKTVILADGVNSILAEKLGMAKRVKPTDVAVGVKELIELPKSVIEDRFQLQGNQGAACLFAGSPTDGLMGGGFLYTNENTLSLGLVCGLHHLHDAKKSVPQMLEDFKQHPAVAPLIAGGKLVEYSAHVVPEAGINMLPELVGDGVLIAGDAAGMCMNLGFTIRGMDLAIAAGEAAAKTVLSAMKSDDFSKQKLAEYRQHLESGPLRDMRMYQKLPAFLDNPRMFSGYPELAVGVARDLFTIDGSAPELMRKKILRHGKKVGFINLIKDGMKGVTVL
>NZ_CP029122.1|WP_000203747.1|4120223_4120511_-|ferredoxin-like-protein-FixX
MTSPVNVDVKLGVNKFNVDEEHPHIVVKADADKQVLELLVKACPAGLYKKQDDGSVRFDYAGCLECGTCRILGLGSALEQWEYPRGTFGVEFRYG
>NZ_CP029122.1|WP_001183198.1|4118834_4120166_-|MFS-transporter
MQPSRNFDDLKFSSIHRRILLWGSGGPFLDGYVLVMIGVALEQLTPALKLDADWIGLLGAGTLAGLFVGTSLFGYISDKVGRRKMFLIDIIAIGVISVATMFVSSPVELLVMRVLIGIVIGADYPIATSMITEFSSTRQRAFSISFIAAMWYVGATCADLVGYWLYDVEGGWRWMLGSAAIPCLLILIGRFELPESPRWLLRKGRVKECEEMMIKLFGEPVAFDEEQPQQTRFRDLFNRRHFPFVLFVAAIWTCQVIPMFAIYTFGPQIVGLLGLGVGKNAALGNVVISLFFMLGCIPPMLWLNTAGRRPLLIGSFAMMTLALAVLGLIPDMGIWLVVMAFAVYAFFSGGPGNLQWLYPNELFPTDIRASAVGVIMSLSRIGTIVSTWALPIFINNYGISNTMLMGAGISLFGLLISVAFAPETRGMSLAQTSNMTIRGQRMG
>NZ_CP029122.1|WP_000600725.1|4118196_4118727_-|glutathione-regulated-potassium-efflux-system-oxidoreductase-KefF
MILIIYAHPYPHHSHANKRMLEQARTLEGVEIRSLYQLYPDFNIDIAAEQEALSRADLIVWQHPMQWYSIPPLLKLWIDKVFSHGWAYGHGGTALHGKHLLWAVTTGGGESHFEIGAHPGFDVLSQPLQATAIYCGLNWLPPFAMHCTFICDDETLEGQARHYKQRLLEWQEAHHG
>NZ_CP029122.1|WP_000377129.1|4116341_4118204_-|glutathione-regulated-potassium-efflux-system-protein-KefC
MDSHTLIQALIYLGSAALIVPIAVRLGLGSVLGYLIAGCIIGPWGLRLVTDAESILHFAEIGVVLMLFIIGLELDPQRLWKLRAAVFGGGALQMVICGGLLGLFCMLLGLRWQVAELIGMTLALSSTAIAMQAMNERNLMVTQMGRSAFAVLLFQDIAAIPLVAMIPLLATSSASTTMGAFALSALKVAGALVLVVLLGRYVTRPALRFVARSGLREVFSAVALFLVFGFGLLLEEVGLSMAMGAFLAGVLLASSEYRHALESDIEPFKGLLLGLFFIGVGMSIDFGTLLENPLRIVILLLGFLIIKIAMLWLIARPLQVPNKQRRWFAVLLGQGSEFAFVVFGAAQMANVLEPEWAKSLTLAVALSMAATPILLVILNRLEQSSTEEAREADEIDEEQPRVIIAGFGRFGQITGRLLLSSGVKMVVLDHDPDHIETLRKFGMKVFYGDATRMDLLESAGAAKAEVLINAIDDPQTNLQLTEMVKEHFPHLQIIARARDVDHYIRLRQAGVEKPERETFEGALKTGRLALESLGLGPYEARERADVFRRFNIQMVEEMAMVENDTKARAAVYKRTSAMLSEIITEDREHLSLIQRHGWQGTEEGKHTGNMADEPETKPSS
>NZ_CP029122.1|WP_000624375.1|4115670_4116150_-|type-3-dihydrofolate-reductase
MISLIAALAVDRVIGMENAMPWNLPADLAWFKRNTLNKPVIMGRHTWESIGRPLPGRKNIILSSQPGTDDRVTWVKSVDEAIAACGDVPEIMVIGGGRVYEQFLPKAQKLYLTHIDAEVEGDTHFPDYEPDDWESVFSEFHDADAQNSHSYCFEILERR
>NZ_CP029122.1|WP_000257192.1|4114750_4115593_+|bis(5'-nucleosyl)-tetraphosphatase-(symmetrical)
MATYLIGDVHGCYDELIALLHKVEFTPGKDTLWLTGDLVARGPGSLDVLRYVKSLGDSVRLVLGNHDLHLLAVFAGISRNKPKDRLTPLLEAPDADELLNWLRRQPLLQIDEEKKLVMAHAGITPQWDLQTAKECARDVEAVLSSDSYPFFLDAMYGDMPNNWSPELRGLGRLRFITNAFTRMRFCFPNGQLDMYSKESPEEAPAPLKPWFAIPGPVAEEYSIAFGHWASLEGKGTPEGIYALDTGCCWGGTLTCLRWEDKQYFVQPSNRHKDLGEAAAS
>NZ_CP029122.1|WP_000610901.1|4114366_4114744_+|Co2+/Mg2+-efflux-protein-ApaG
MINSPRVCIQVQSVYIEAQSSPDNERYVFAYTVTIRNLGRAPVQLLGRYWLITNGNGRETEVQGEGVVGVQPLIAPGEEYQYTSGAIIETPLGTMQGHYEMIDENGVPFSIDIPVFRLAVPTLIH
>NZ_CP029122.1|WP_000787103.1|4124044_4125559_+|L-carnitine/gamma-butyrobetaine-antiport-BCCT-transporter
MKNEKRKTGIEPKVFFPPLIIVGILCWLTVRDLDAANVVINAVFSYVTNVWGWAFEWYMVVMLFGWFWLVFGPYAKKRLGNEPPEFSTASWIFMMFASCTSAAVLFWGSIEIYYYISTPPFGLEPNSTGAKELGLAYSLFHWGPLPWATYSFLSVAFAYFFFVRKMEVIRPSSTLVPLVGEKHAKGLFGTIVDNFYLVALIFAMGTSLGLATPLVTECMQWLFGIPHTLQLDAIIITCWIILNAICVACGLQKGVRIASDVRSYLSFLMLGWVFIVSGASFIMNYFTDSVGMLLMYLPRMLFYTDPIAKGGFPQGWTVFYWAWWVIYAIQMSIFLARISRGRTVRELCFGMVLGLTASTWILWTVLGSNTLLLIDKNIINIPNLIEQYGVARAIIETWAALPLSTATMWGFFILCFIATVTLVNACSYTLAMSTCREVRDGEEPPLLVRIGWSILVGIIGIVLLALGGLKPIQTAIIAGGCPLFFVNIMVTLSFIKDAKQNWKD
>NZ_CP029122.1|WP_000347117.1|4125589_4126732_+|crotonobetainyl-CoA-dehydrogenase
MDFNLNDEQELFVAGIRELMASENWEAYFAECDRDSVYPERFVKALADMGIDSLLIPEEHGGLDAGFVTLAAVWMELGRLGAPTYVLYQLPGGFNTFLREGTQEQIDKIMAFRGTGKQMWNSAITEPGAGSDVGSLKTTYTRRNGKIYLNGSKCFITSSAYTPYIVVMARDGASPDKPVYTEWFVDMSKPGIKVTKLEKLGLRMDSCCEITFDDVELDEKDMFGREGNGFNRVKEEFDHERFLVALTNYGTAMCAFEDAARYANQRVQFGEAIGRFQLIQEKFAHMAIKLNSMKNMLYEAAWKADNGTITSGDAAMCKYFCANAAFEVVDSAMQVLGGVGIAGNHRISRFWRDLRVDRVSGGSDEMQILTLGRAVLKQYR
>NZ_CP029122.1|WP_000349926.1|4126860_4128078_+|L-carnitine-CoA-transferase
MDHLPMPKFGPLAGLRVVFSGIEIAGPFAGQMFAEWGAEVIWIENVAWADTIRVQPNYPQLSRRNLHALSLNIFKDEGREAFLKLMETTDIFIEASKGPAFARRGITDEVLWQHNPKLVIAHLSGFGQYGTEEYTNLPAYNTIAQAFSGYLIQNGDVDQPMPAFPYTADYFSGLTATTAALAALHKARETGKGESIDIAMYEVMLRMGQYFMMDYFNGGEMCPRMSKGKDPYYAGCGLYKCADGYIVMELVGITQIEECFKDIGLAHLLSTPEIPEGTQLIHRIECPYGPLVEEKLDAWLAAHTIAEVKERFAELNIACAKVLTVPELESNPQYVARESITQWQTMDGRTCKGPNIMPKFKNNPGQIWRGMPSHGMDTAAILKNIGYSENDIQELVSKGLAKVED
>NZ_CP029122.1|WP_000351348.1|4128151_4129705_+|crotonobetaine/carnitine-CoA-ligase
MDIIGGQHLRQMWDDLADVYGHKTALICESSGGVVNRYSYLELNQEINRTANLFYTLGIRKGDKVALHLDNCPEFIFCWFGLAKIGAIMVPINARLLREESAWILQNSQACLLVTSAQFYPMYQQIQQEDATQLRHICLTDVALPADDGVSSFTQLKNQQPATLCYAPPLLTDDTAEILFTSGTTSRPKGVVITHYNLRFAGYYSAWQCALRDDDVYLTVMPAFHIDCQCTAAMAAFSAGATFVLVEKYSARAFWGQVQKYRATITECIPMMIRTLMVQPPSANDRQHRLREVMFYLNLSEQEKDAFCERFGVRLLTSYGMTETIVGIIGDRPGDKRRWPSIGRAGFCYEAEIRDDHNRPLPAGEIGEICIKGVPGKTIFKEYFLNPKATAKVLEADGWLHTGDTGYCDEEGFFYFVDRRCNMIKRGGENVSCVELENIIATHPKIQDIVVVGIKDSIRDEAIKAFVVLNEGETLSEEEFFRFCEQNMAKFKVPSYLEIRKDLPRNCSGKIIRKNLK
>NZ_CP029122.1|WP_000004404.1|4129813_4130599_+|crotonobetainyl-CoA-hydratase
MSESLHLTRNGSILEITLDRPKANAIDAKTSFEMGEVFLNFRDDPQLRVAIITGAGEKFFSAGWDLKAAAEGEAPDADFGPGGFAGLTEIFNLDKPVIAAVNGYAFGGGFELALAADFIVCADNASFALPEAKLGIVPDSGGVLRLPKILPPAIVNEMVMTGRRMGTEEALRWGIVNRVVSQAELMDNARELAQQLVNSAPLAIAALKEIYRTTSEMPVEEAYRYIRSGVLKHYPSVLHSEDAVEGPLAFAEKRDPVWKGR
>NZ_CP029122.1|WP_000122876.1|4130604_4131195_+|carnitine-operon-protein-CaiE
MSYYAFEGLIPVVHPTAFVHPSAVLIGDVIVGAGVYIGPLASLRGDYGRLIVQAGANIQDGCIMHGYCDTDTIVGENGHIGHGAILHGCVIGRDALVGMNSVIMDGAVIGEESIVAAMSFVKAGFHGEKRQLLMGTPARAVRSVSDDELHWKRLNTKEYQDLVGRCHASLHETQPLRQMEENRPRLQGTTDVTPKR
>NZ_CP029122.1|WP_000333120.1|4131280_4131676_-|carnitine-metabolism-transcriptional-regulator-CaiF
MCEGYVEKPLYLLIAEWMMAENRWVIAREISIHFDIEHSKAVNTLTYILSEVAEISCEVKMIPNKLEGRGCQCQRLVKVVDIDEQIYARLRNNSRDKLVGVRKTPRIPAVPLTELNREQKWQMMLSKSMRR
>NZ_CP029122.1|WP_001126376.1|4131936_4135158_-|carbamoyl-phosphate-synthase-large-subunit
MPKRTDIKSILILGAGPIVIGQACEFDYSGAQACKALREEGYRVILVNSNPATIMTDPEMADATYIEPIHWEVVRKIIEKERPDAVLPTMGGQTALNCALELERQGVLEEFGVTMIGATADAIDKAEDRRRFDVAMKKIGLETARSGIAHTMEEALAVAADVGFPCIIRPSFTMGGSGGGIAYNREEFEEICARGLDLSPTKELLIDESLIGWKEYEMEVVRDKNDNCIIVCSIENFDAMGIHTGDSITVAPAQTLTDKEYQIMRNASMAVLREIGVETGGSNVQFAVNPKNGRLIVIEMNPRVSRSSALASKATGFPIAKVAAKLAVGYTLDELMNDITGGRTPASFEPSIDYVVTKIPRFNFEKFAGANDRLTTQMKSVGEVMAIGRTQQESLQKALRGLEVGATGFDPKVSLDDPEALTKIRRELKDAGAERIWYIADAFRAGLSVDGVFNLTNIDRWFLVQIEELVRLEEKVAEVGITGLNAEFLRQLKRKGFADARLAKLAGVREAEIRKLRDQYDLHPVYKRVDTCAAEFATDTAYMYSTYEEECEANPSTDREKIMVLGGGPNRIGQGIEFDYCCVHASLALREDGYETIMVNCNPETVSTDYDTSDRLYFEPVTLEDVLEIVRIEKPKGVIVQYGGQTPLKLARALEAAGVPVIGTSPDAIDRAEDRERFQHAVERLKLKQPANATVTAIEMAVEKAKEIGYPLVVRPSYVLGGRAMEIVYDEADLRRYFQTAVSVSNDAPVLLDHFLDDAVEVDVDAICDGEMVLIGGIMEHIEQAGVHSGDSACSLPAYTLSQEIQDVMRQQVQKLAFELQVRGLMNVQFAVKNNEVYLIEVNPRAARTVPFVSKATGVPLAKVAARVMAGKSLAEQGVTKEVIPPYYSVKEVVLPFNKFPGVDPLLGPEMRSTGEVMGVGRTFAEAFAKAQLGSNSTMKKHGRALLSVREGDKERVVDLAAKLLKQGFELDATHGTAIVLGEAGINPRLVNKVHEGRPHIQDRIKNGEYTYIINTTSGRRAIEDSRVIRRSALQYKVHYDTTLNGGFATAMALNADATEKVISVQEMHAQIK
>NZ_CP029122.1|WP_000597260.1|4135175_4136324_-|glutamine-hydrolyzing-carbamoyl-phosphate-synthase-small-subunit
MIKSALLVLEDGTQFHGRAIGATGSAVGEVVFNTSMTGYQEILTDPSYSRQIVTLTYPHIGNVGTNDADEESSQVHAQGLVIRDLPLIASNFRNTEDLSSYLKRHNIVAIADIDTRKLTRLLREKGAQNGCIIAGDNPDAALALEKARAFPGLNGMDLAKEVTTAEAYSWTQGSWTLTGGLPEAKKEDELPFHVVAYDFGAKRNILRMLVDRGCRLTIVPAQTSAEDVLKMNPDGIFLSNGPGDPAPCDYAITAIQKFLETDIPVFGICLGHQLLALASGAKTVKMKFGHHGGNHPVKDVEKNVVMITAQNHGFAVDEATLPANLRVTHKSLFDGTLQGIHRTDKPAFSFQGHPEASPGPHDAAPLFDHFIELIEQYRKTAK
>NZ_CP029122.1|WP_000543597.1|4136779_4137601_-|4-hydroxy-tetrahydrodipicolinate-reductase
MHDANIRVAIAGAGGRMGRQLIQAALALEGVQLGAALEREGSSLLGSDAGELAGAGKTGVTVQSSLDAVKDDFDVFIDFTRPEGTLNHLAFCRQHGKGMVIGTTGFDEAGKQAIRDAAADIAIVFAANFSVGVNVMLKLLEKAAKVMGDYTDIEIIEAHHRHKVDAPSGTALAMGEAIAHALDKDLKDCAVYSREGHTGERVPGTIGFATVRAGDIVGEHTAMFADIGERLEITHKASSRMTFANGAVRSALWLSGKEGGLFDMRDVLDLNSL

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Mismatch	Identity

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity
NZ_CP029122_7	7.1\|3110451\|40\|NZ_CP029122\|CRISPRCasFinder	3110451-3110490	40	NZ_CP041417	Escherichia coli strain STEC711 plasmid pSTEC711_1, complete sequence	47951-47990	0	1.0
NZ_CP029122_11	11.1\|4123679\|42\|NZ_CP029122\|PILER-CR	4123679-4123720	42	NZ_AP023206	Escherichia coli strain TUM18781 plasmid pMTY18781-1_lncX3, complete sequence	141085-141126	0	1.0
NZ_CP029122_11	11.2\|4123738\|40\|NZ_CP029122\|PILER-CR	4123738-4123777	40	NZ_AP023206	Escherichia coli strain TUM18781 plasmid pMTY18781-1_lncX3, complete sequence	141028-141067	1	0.975
NZ_CP029122_6	6.1\|2457209\|38\|NZ_CP029122\|CRISPRCasFinder	2457209-2457246	38	NZ_CP043437	Enterobacter sp. LU1 plasmid unnamed	113727-113764	2	0.947
NZ_CP029122_9	9.1\|3910518\|48\|NZ_CP029122\|CRISPRCasFinder	3910518-3910565	48	NZ_CP053606	Escherichia coli strain NEB_Turbo plasmid F', complete sequence	4089-4136	3	0.938
NZ_CP029122_9	9.1\|3910518\|48\|NZ_CP029122\|CRISPRCasFinder	3910518-3910565	48	NZ_CP053608	Escherichia coli strain NEB5-alpha_F'Iq plasmid F'Iq, complete sequence	4088-4135	3	0.938
NZ_CP029122_9	9.1\|3910518\|48\|NZ_CP029122\|CRISPRCasFinder	3910518-3910565	48	NZ_CP014271	Escherichia coli K-12 strain K-12 DHB4 plasmid F128-(DHB4), complete sequence	4088-4135	3	0.938
NZ_CP029122_9	9.1\|3910518\|48\|NZ_CP029122\|CRISPRCasFinder	3910518-3910565	48	NZ_CP014273	Escherichia coli K-12 strain K-12 C3026 plasmid F128-(C3026), complete sequence	4088-4135	3	0.938
NZ_CP029122_1	1.1\|892312\|42\|NZ_CP029122\|CRISPRCasFinder	892312-892353	42	NZ_CP010208	Escherichia coli strain M11 plasmid B, complete sequence	30214-30255	7	0.833
NZ_CP029122_3	3.7\|1310998\|32\|NZ_CP029122\|PILER-CR,CRISPRCasFinder,CRT	1310998-1311029	32	NZ_MG299151	Shigella sonnei strain SH287-2 plasmid pSH287-2, complete sequence	51276-51307	7	0.781
NZ_CP029122_3	3.7\|1310998\|32\|NZ_CP029122\|PILER-CR,CRISPRCasFinder,CRT	1310998-1311029	32	NZ_KY471628	Shigella sonnei strain SH15sh99 plasmid pSH15sh99, complete sequence	45716-45747	7	0.781
NZ_CP029122_3	3.7\|1310998\|32\|NZ_CP029122\|PILER-CR,CRISPRCasFinder,CRT	1310998-1311029	32	NZ_MG299131	Shigella sonnei strain SH271-2 plasmid pSH271-2, complete sequence	51276-51307	7	0.781
NZ_CP029122_3	3.7\|1310998\|32\|NZ_CP029122\|PILER-CR,CRISPRCasFinder,CRT	1310998-1311029	32	NZ_KY471629	Shigella sonnei strain SH15sh105 plasmid pSH15sh104, complete sequence	45716-45747	7	0.781
NZ_CP029122_3	3.7\|1310998\|32\|NZ_CP029122\|PILER-CR,CRISPRCasFinder,CRT	1310998-1311029	32	NZ_MG299133	Shigella sonnei strain SH272-2 plasmid pSH272-2, complete sequence	51276-51307	7	0.781
NZ_CP029122_3	3.7\|1310998\|32\|NZ_CP029122\|PILER-CR,CRISPRCasFinder,CRT	1310998-1311029	32	NZ_MG299128	Shigella sonnei strain SH262-2 plasmid pSH262-2, complete sequence	51276-51307	7	0.781
NZ_CP029122_3	3.7\|1310998\|32\|NZ_CP029122\|PILER-CR,CRISPRCasFinder,CRT	1310998-1311029	32	NZ_MG299147	Shigella sonnei strain SH284-2 plasmid pSH284-2, complete sequence	51276-51307	7	0.781
NZ_CP029122_3	3.7\|1310998\|32\|NZ_CP029122\|PILER-CR,CRISPRCasFinder,CRT	1310998-1311029	32	NC_018995	Escherichia coli plasmid pHUSEC41-1, complete sequence	29015-29046	7	0.781
NZ_CP029122_3	3.7\|1310998\|32\|NZ_CP029122\|PILER-CR,CRISPRCasFinder,CRT	1310998-1311029	32	NZ_CP053235	Escherichia coli strain SCU-106 plasmid pSCU-106-1, complete sequence	78292-78323	7	0.781
NZ_CP029122_3	3.7\|1310998\|32\|NZ_CP029122\|PILER-CR,CRISPRCasFinder,CRT	1310998-1311029	32	NZ_CP005999	Escherichia coli B7A plasmid pEB1, complete sequence	39563-39594	7	0.781
NZ_CP029122_3	3.7\|1310998\|32\|NZ_CP029122\|PILER-CR,CRISPRCasFinder,CRT	1310998-1311029	32	KU932021	Escherichia coli plasmid pEC3I, complete sequence	51902-51933	7	0.781
NZ_CP029122_3	3.7\|1310998\|32\|NZ_CP029122\|PILER-CR,CRISPRCasFinder,CRT	1310998-1311029	32	NZ_CP024154	Escherichia coli strain 14EC033 plasmid p14EC033g, complete sequence	18560-18591	7	0.781
NZ_CP029122_3	3.7\|1310998\|32\|NZ_CP029122\|PILER-CR,CRISPRCasFinder,CRT	1310998-1311029	32	NC_011754	Escherichia coli ED1a plasmid pECOED, complete sequence	49240-49271	7	0.781
NZ_CP029122_3	3.7\|1310998\|32\|NZ_CP029122\|PILER-CR,CRISPRCasFinder,CRT	1310998-1311029	32	NZ_CP015141	Escherichia coli strain Ecol_732 plasmid pEC732_3, complete sequence	81434-81465	7	0.781
NZ_CP029122_3	3.7\|1310998\|32\|NZ_CP029122\|PILER-CR,CRISPRCasFinder,CRT	1310998-1311029	32	NZ_LR213460	Shigella sonnei strain AUSMDU00008333 isolate AUSMDU00008333 plasmid 3	28916-28947	7	0.781
NZ_CP029122_3	3.7\|1310998\|32\|NZ_CP029122\|PILER-CR,CRISPRCasFinder,CRT	1310998-1311029	32	NZ_MH287044	Escherichia coli strain 5.1-R1 plasmid pCERC6, complete sequence	36182-36213	7	0.781
NZ_CP029122_3	3.7\|1310998\|32\|NZ_CP029122\|PILER-CR,CRISPRCasFinder,CRT	1310998-1311029	32	NZ_MH618673	Escherichia coli strain 838B plasmid p838B-R, complete sequence	32230-32261	7	0.781
NZ_CP029122_4	4.1\|1333534\|31\|NZ_CP029122\|CRISPRCasFinder	1333534-1333564	31	NC_007336	Cupriavidus pinatubonensis JMP134 megaplasmid, complete sequence	62682-62712	7	0.774
NZ_CP029122_4	4.1\|1333534\|31\|NZ_CP029122\|CRISPRCasFinder	1333534-1333564	31	NZ_CP013104	Paraburkholderia caribensis strain MWAP64 plasmid 1, complete sequence	1222106-1222136	7	0.774
NZ_CP029122_4	4.1\|1333534\|31\|NZ_CP029122\|CRISPRCasFinder	1333534-1333564	31	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	2467672-2467702	7	0.774
NZ_CP029122_4	4.4\|1333717\|31\|NZ_CP029122\|CRISPRCasFinder	1333717-1333747	31	NZ_CP034185	Deinococcus sp. S14-83 strain S14-83T plasmid unnamed1, complete sequence	17977-18007	7	0.774
NZ_CP029122_4	4.7\|1333900\|31\|NZ_CP029122\|CRISPRCasFinder	1333900-1333930	31	NC_007336	Cupriavidus pinatubonensis JMP134 megaplasmid, complete sequence	530641-530671	7	0.774
NZ_CP029122_1	1.1\|892312\|42\|NZ_CP029122\|CRISPRCasFinder	892312-892353	42	NZ_CP048307	Escherichia coli strain 9 plasmid p009_C, complete sequence	24899-24940	8	0.81
NZ_CP029122_3	3.6\|1310937\|32\|NZ_CP029122\|PILER-CR,CRISPRCasFinder,CRT	1310937-1310968	32	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	1417960-1417991	8	0.75
NZ_CP029122_4	4.4\|1333717\|31\|NZ_CP029122\|CRISPRCasFinder	1333717-1333747	31	NZ_CP017753	Cupriavidus sp. USMAHM13 plasmid unnamed1, complete sequence	97498-97528	8	0.742
NZ_CP029122_4	4.7\|1333900\|31\|NZ_CP029122\|CRISPRCasFinder	1333900-1333930	31	NZ_CP036297	Planctomycetes bacterium Pla86 plasmid pPla86_1, complete sequence	14953-14983	8	0.742
NZ_CP029122_4	4.7\|1333900\|31\|NZ_CP029122\|CRISPRCasFinder	1333900-1333930	31	NZ_CP036288	Planctomycetes bacterium Pla133 plasmid pPla133_1, complete sequence	14983-15013	8	0.742
NZ_CP029122_4	4.7\|1333900\|31\|NZ_CP029122\|CRISPRCasFinder	1333900-1333930	31	NZ_CP015882	Ensifer adhaerens strain Casida A plasmid pCasidaAB, complete sequence	3454-3484	8	0.742
NZ_CP029122_4	4.7\|1333900\|31\|NZ_CP029122\|CRISPRCasFinder	1333900-1333930	31	NZ_CP017750	Cupriavidus sp. USMAA2-4 plasmid unnamed1, complete sequence	148992-149022	8	0.742
NZ_CP029122_4	4.10\|1333533\|33\|NZ_CP029122\|PILER-CR	1333533-1333565	33	NC_007336	Cupriavidus pinatubonensis JMP134 megaplasmid, complete sequence	62681-62713	8	0.758
NZ_CP029122_4	4.16\|1333899\|33\|NZ_CP029122\|PILER-CR	1333899-1333931	33	NC_007336	Cupriavidus pinatubonensis JMP134 megaplasmid, complete sequence	530640-530672	8	0.758
NZ_CP029122_4	4.19\|1333534\|32\|NZ_CP029122\|CRT	1333534-1333565	32	NC_007336	Cupriavidus pinatubonensis JMP134 megaplasmid, complete sequence	62682-62713	8	0.75
NZ_CP029122_4	4.19\|1333534\|32\|NZ_CP029122\|CRT	1333534-1333565	32	NZ_CP013104	Paraburkholderia caribensis strain MWAP64 plasmid 1, complete sequence	1222106-1222137	8	0.75
NZ_CP029122_4	4.19\|1333534\|32\|NZ_CP029122\|CRT	1333534-1333565	32	NZ_CP012748	Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence	2467671-2467702	8	0.75
NZ_CP029122_4	4.19\|1333534\|32\|NZ_CP029122\|CRT	1333534-1333565	32	NC_008759	Polaromonas naphthalenivorans CJ2 plasmid pPNAP03, complete sequence	12670-12701	8	0.75
NZ_CP029122_4	4.22\|1333717\|32\|NZ_CP029122\|CRT	1333717-1333748	32	NZ_CP034185	Deinococcus sp. S14-83 strain S14-83T plasmid unnamed1, complete sequence	17977-18008	8	0.75
NZ_CP029122_4	4.22\|1333717\|32\|NZ_CP029122\|CRT	1333717-1333748	32	NZ_CP017753	Cupriavidus sp. USMAHM13 plasmid unnamed1, complete sequence	97497-97528	8	0.75
NZ_CP029122_4	4.25\|1333900\|32\|NZ_CP029122\|CRT	1333900-1333931	32	NZ_CP017750	Cupriavidus sp. USMAA2-4 plasmid unnamed1, complete sequence	148991-149022	8	0.75
NZ_CP029122_4	4.25\|1333900\|32\|NZ_CP029122\|CRT	1333900-1333931	32	NC_007336	Cupriavidus pinatubonensis JMP134 megaplasmid, complete sequence	530640-530671	8	0.75
NZ_CP029122_4	4.26\|1333961\|32\|NZ_CP029122\|CRT	1333961-1333992	32	NZ_CP006991	Rhizobium sp. IE4771 plasmid pRetIE4771e, complete sequence	532343-532374	8	0.75
NZ_CP029122_1	1.1\|892312\|42\|NZ_CP029122\|CRISPRCasFinder	892312-892353	42	NZ_CP048307	Escherichia coli strain 9 plasmid p009_C, complete sequence	24786-24827	9	0.786
NZ_CP029122_4	4.1\|1333534\|31\|NZ_CP029122\|CRISPRCasFinder	1333534-1333564	31	NC_011987	Agrobacterium radiobacter K84 plasmid pAtK84c, complete sequence	86182-86212	9	0.71
NZ_CP029122_4	4.2\|1333595\|31\|NZ_CP029122\|CRISPRCasFinder	1333595-1333625	31	CP011075	Brevibacillus laterosporus strain B9 plasmid unnamed1, complete sequence	244686-244716	9	0.71
NZ_CP029122_4	4.2\|1333595\|31\|NZ_CP029122\|CRISPRCasFinder	1333595-1333625	31	GU075905	Prochlorococcus phage P-HM2, complete genome	78536-78566	9	0.71
NZ_CP029122_4	4.4\|1333717\|31\|NZ_CP029122\|CRISPRCasFinder	1333717-1333747	31	NZ_CP017750	Cupriavidus sp. USMAA2-4 plasmid unnamed1, complete sequence	405875-405905	9	0.71
NZ_CP029122_4	4.4\|1333717\|31\|NZ_CP029122\|CRISPRCasFinder	1333717-1333747	31	NZ_AP022593	Mycolicibacterium arabiense strain JCM 18538 plasmid pJCM18538, complete sequence	2248363-2248393	9	0.71
NZ_CP029122_4	4.8\|1333961\|31\|NZ_CP029122\|CRISPRCasFinder	1333961-1333991	31	NZ_CP040723	Rhodococcus pyridinivorans strain YF3 plasmid unnamed4, complete sequence	35740-35770	9	0.71
NZ_CP029122_4	4.10\|1333533\|33\|NZ_CP029122\|PILER-CR	1333533-1333565	33	NC_011987	Agrobacterium radiobacter K84 plasmid pAtK84c, complete sequence	86181-86213	9	0.727
NZ_CP029122_4	4.13\|1333716\|33\|NZ_CP029122\|PILER-CR	1333716-1333748	33	NZ_CP034185	Deinococcus sp. S14-83 strain S14-83T plasmid unnamed1, complete sequence	17976-18008	9	0.727
NZ_CP029122_4	4.22\|1333717\|32\|NZ_CP029122\|CRT	1333717-1333748	32	NZ_CP017750	Cupriavidus sp. USMAA2-4 plasmid unnamed1, complete sequence	405875-405906	9	0.719
NZ_CP029122_4	4.25\|1333900\|32\|NZ_CP029122\|CRT	1333900-1333931	32	NZ_CP036297	Planctomycetes bacterium Pla86 plasmid pPla86_1, complete sequence	14953-14984	9	0.719
NZ_CP029122_4	4.25\|1333900\|32\|NZ_CP029122\|CRT	1333900-1333931	32	NZ_CP036288	Planctomycetes bacterium Pla133 plasmid pPla133_1, complete sequence	14983-15014	9	0.719
NZ_CP029122_4	4.25\|1333900\|32\|NZ_CP029122\|CRT	1333900-1333931	32	NZ_CP015882	Ensifer adhaerens strain Casida A plasmid pCasidaAB, complete sequence	3454-3485	9	0.719
NZ_CP029122_4	4.26\|1333961\|32\|NZ_CP029122\|CRT	1333961-1333992	32	NZ_CP040723	Rhodococcus pyridinivorans strain YF3 plasmid unnamed4, complete sequence	35740-35771	9	0.719
NZ_CP029122_3	3.1\|1310632\|32\|NZ_CP029122\|PILER-CR,CRISPRCasFinder,CRT	1310632-1310663	32	NZ_CP030933	Enterococcus gilvus strain CR1 plasmid pCR1A, complete sequence	51062-51093	10	0.688
NZ_CP029122_4	4.11\|1333594\|33\|NZ_CP029122\|PILER-CR	1333594-1333626	33	GU075905	Prochlorococcus phage P-HM2, complete genome	78535-78567	10	0.697
NZ_CP029122_4	4.16\|1333899\|33\|NZ_CP029122\|PILER-CR	1333899-1333931	33	NZ_CP036297	Planctomycetes bacterium Pla86 plasmid pPla86_1, complete sequence	14952-14984	10	0.697
NZ_CP029122_4	4.16\|1333899\|33\|NZ_CP029122\|PILER-CR	1333899-1333931	33	NZ_CP036288	Planctomycetes bacterium Pla133 plasmid pPla133_1, complete sequence	14982-15014	10	0.697
NZ_CP029122_4	4.17\|1333960\|33\|NZ_CP029122\|PILER-CR	1333960-1333992	33	NZ_CP040723	Rhodococcus pyridinivorans strain YF3 plasmid unnamed4, complete sequence	35739-35771	10	0.697
NZ_CP029122_4	4.19\|1333534\|32\|NZ_CP029122\|CRT	1333534-1333565	32	NC_011987	Agrobacterium radiobacter K84 plasmid pAtK84c, complete sequence	86181-86212	10	0.688
NZ_CP029122_4	4.20\|1333595\|32\|NZ_CP029122\|CRT	1333595-1333626	32	CP011075	Brevibacillus laterosporus strain B9 plasmid unnamed1, complete sequence	244686-244717	10	0.688
NZ_CP029122_4	4.20\|1333595\|32\|NZ_CP029122\|CRT	1333595-1333626	32	GU075905	Prochlorococcus phage P-HM2, complete genome	78536-78567	10	0.688
NZ_CP029122_4	4.22\|1333717\|32\|NZ_CP029122\|CRT	1333717-1333748	32	NZ_AP022593	Mycolicibacterium arabiense strain JCM 18538 plasmid pJCM18538, complete sequence	2248362-2248393	10	0.688

1. spacer 7.1|3110451|40|NZ_CP029122|CRISPRCasFinder matches to NZ_CP041417 (Escherichia coli strain STEC711 plasmid pSTEC711_1, complete sequence) position: , mismatch: 0, identity: 1.0

gcgctgcgggtcattcttgaaattacccccgctgtgctgt	CRISPR spacer
gcgctgcgggtcattcttgaaattacccccgctgtgctgt	Protospacer
****************************************

2. spacer 11.1|4123679|42|NZ_CP029122|PILER-CR matches to NZ_AP023206 (Escherichia coli strain TUM18781 plasmid pMTY18781-1_lncX3, complete sequence) position: , mismatch: 0, identity: 1.0

tgtcacacgcagataaatccaactttcaatattgttaagttc	CRISPR spacer
tgtcacacgcagataaatccaactttcaatattgttaagttc	Protospacer
******************************************

3. spacer 11.2|4123738|40|NZ_CP029122|PILER-CR matches to NZ_AP023206 (Escherichia coli strain TUM18781 plasmid pMTY18781-1_lncX3, complete sequence) position: , mismatch: 1, identity: 0.975

catggcgtagcaaaaagaaattttcaatattgctttatgg	CRISPR spacer
catggcgtagaaaaaagaaattttcaatattgctttatgg	Protospacer
********** *****************************

4. spacer 6.1|2457209|38|NZ_CP029122|CRISPRCasFinder matches to NZ_CP043437 (Enterobacter sp. LU1 plasmid unnamed) position: , mismatch: 2, identity: 0.947

cggacgcaggatggtgcgttcaattggactcgaaccaa	CRISPR spacer
cagacgcagaatggtgcgttcaattggactcgaaccaa	Protospacer
*.*******.****************************

5. spacer 9.1|3910518|48|NZ_CP029122|CRISPRCasFinder matches to NZ_CP053606 (Escherichia coli strain NEB_Turbo plasmid F', complete sequence) position: , mismatch: 3, identity: 0.938

tcagcgtcgcatcaggcatctgcgcataaccgccggatgcggcgtaaa	CRISPR spacer
ccagcgtcgcatcaggcatctgcgcataactgccggatgcggcataaa	Protospacer
.*****************************.************.****

6. spacer 9.1|3910518|48|NZ_CP029122|CRISPRCasFinder matches to NZ_CP053608 (Escherichia coli strain NEB5-alpha_F'Iq plasmid F'Iq, complete sequence) position: , mismatch: 3, identity: 0.938

tcagcgtcgcatcaggcatctgcgcataaccgccggatgcggcgtaaa	CRISPR spacer
ccagcgtcgcatcaggcatctgcgcataactgccggatgcggcataaa	Protospacer
.*****************************.************.****

7. spacer 9.1|3910518|48|NZ_CP029122|CRISPRCasFinder matches to NZ_CP014271 (Escherichia coli K-12 strain K-12 DHB4 plasmid F128-(DHB4), complete sequence) position: , mismatch: 3, identity: 0.938

tcagcgtcgcatcaggcatctgcgcataaccgccggatgcggcgtaaa	CRISPR spacer
ccagcgtcgcatcaggcatctgcgcataactgccggatgcggcataaa	Protospacer
.*****************************.************.****

8. spacer 9.1|3910518|48|NZ_CP029122|CRISPRCasFinder matches to NZ_CP014273 (Escherichia coli K-12 strain K-12 C3026 plasmid F128-(C3026), complete sequence) position: , mismatch: 3, identity: 0.938

tcagcgtcgcatcaggcatctgcgcataaccgccggatgcggcgtaaa	CRISPR spacer
ccagcgtcgcatcaggcatctgcgcataactgccggatgcggcataaa	Protospacer
.*****************************.************.****

9. spacer 1.1|892312|42|NZ_CP029122|CRISPRCasFinder matches to NZ_CP010208 (Escherichia coli strain M11 plasmid B, complete sequence) position: , mismatch: 7, identity: 0.833

acagcagtcggatgcggcgtaaacaccttatctgacctacgt	CRISPR spacer
acaaatgccggatgcggcgtaaacgccttatctggcctacgc	Protospacer
***.  *.****************.*********.******.

10. spacer 3.7|1310998|32|NZ_CP029122|PILER-CR,CRISPRCasFinder,CRT matches to NZ_MG299151 (Shigella sonnei strain SH287-2 plasmid pSH287-2, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

11. spacer 3.7|1310998|32|NZ_CP029122|PILER-CR,CRISPRCasFinder,CRT matches to NZ_KY471628 (Shigella sonnei strain SH15sh99 plasmid pSH15sh99, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

12. spacer 3.7|1310998|32|NZ_CP029122|PILER-CR,CRISPRCasFinder,CRT matches to NZ_MG299131 (Shigella sonnei strain SH271-2 plasmid pSH271-2, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

13. spacer 3.7|1310998|32|NZ_CP029122|PILER-CR,CRISPRCasFinder,CRT matches to NZ_KY471629 (Shigella sonnei strain SH15sh105 plasmid pSH15sh104, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

14. spacer 3.7|1310998|32|NZ_CP029122|PILER-CR,CRISPRCasFinder,CRT matches to NZ_MG299133 (Shigella sonnei strain SH272-2 plasmid pSH272-2, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

15. spacer 3.7|1310998|32|NZ_CP029122|PILER-CR,CRISPRCasFinder,CRT matches to NZ_MG299128 (Shigella sonnei strain SH262-2 plasmid pSH262-2, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

16. spacer 3.7|1310998|32|NZ_CP029122|PILER-CR,CRISPRCasFinder,CRT matches to NZ_MG299147 (Shigella sonnei strain SH284-2 plasmid pSH284-2, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

17. spacer 3.7|1310998|32|NZ_CP029122|PILER-CR,CRISPRCasFinder,CRT matches to NC_018995 (Escherichia coli plasmid pHUSEC41-1, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

18. spacer 3.7|1310998|32|NZ_CP029122|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP053235 (Escherichia coli strain SCU-106 plasmid pSCU-106-1, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

19. spacer 3.7|1310998|32|NZ_CP029122|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP005999 (Escherichia coli B7A plasmid pEB1, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

20. spacer 3.7|1310998|32|NZ_CP029122|PILER-CR,CRISPRCasFinder,CRT matches to KU932021 (Escherichia coli plasmid pEC3I, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

21. spacer 3.7|1310998|32|NZ_CP029122|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP024154 (Escherichia coli strain 14EC033 plasmid p14EC033g, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

22. spacer 3.7|1310998|32|NZ_CP029122|PILER-CR,CRISPRCasFinder,CRT matches to NC_011754 (Escherichia coli ED1a plasmid pECOED, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

23. spacer 3.7|1310998|32|NZ_CP029122|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP015141 (Escherichia coli strain Ecol_732 plasmid pEC732_3, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

24. spacer 3.7|1310998|32|NZ_CP029122|PILER-CR,CRISPRCasFinder,CRT matches to NZ_LR213460 (Shigella sonnei strain AUSMDU00008333 isolate AUSMDU00008333 plasmid 3) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

25. spacer 3.7|1310998|32|NZ_CP029122|PILER-CR,CRISPRCasFinder,CRT matches to NZ_MH287044 (Escherichia coli strain 5.1-R1 plasmid pCERC6, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

26. spacer 3.7|1310998|32|NZ_CP029122|PILER-CR,CRISPRCasFinder,CRT matches to NZ_MH618673 (Escherichia coli strain 838B plasmid p838B-R, complete sequence) position: , mismatch: 7, identity: 0.781

aaatatccagggctgggctggaggcagacggc--	CRISPR spacer
cgttatccagggctgagctgcaggcag--ggcca	Protospacer
 . ************.**** ******  ***

27. spacer 4.1|1333534|31|NZ_CP029122|CRISPRCasFinder matches to NC_007336 (Cupriavidus pinatubonensis JMP134 megaplasmid, complete sequence) position: , mismatch: 7, identity: 0.774

ttgcccgcgcaattccgggagcatccgcaat	CRISPR spacer
tccctatcgcaatgccggcagcatccgcaat	Protospacer
*. *.  ****** **** ************

28. spacer 4.1|1333534|31|NZ_CP029122|CRISPRCasFinder matches to NZ_CP013104 (Paraburkholderia caribensis strain MWAP64 plasmid 1, complete sequence) position: , mismatch: 7, identity: 0.774

ttgcccgcgcaattccgggagcatccgcaat	CRISPR spacer
ttgcgcgcgcaattccgtgagcagcgccatc	Protospacer
**** ************ ***** *  ** .

29. spacer 4.1|1333534|31|NZ_CP029122|CRISPRCasFinder matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 7, identity: 0.774

ttgcccgcgcaattccgggagcatccgcaat	CRISPR spacer
ttgcgcgcgcaattccgtgagcagcgccatc	Protospacer
**** ************ ***** *  ** .

30. spacer 4.4|1333717|31|NZ_CP029122|CRISPRCasFinder matches to NZ_CP034185 (Deinococcus sp. S14-83 strain S14-83T plasmid unnamed1, complete sequence) position: , mismatch: 7, identity: 0.774

cccgtcaccgacgcgcagtggcgctaccgtg	CRISPR spacer
agcgtcaccgacgcgcagggccgctaccaac	Protospacer
  **************** * *******.

31. spacer 4.7|1333900|31|NZ_CP029122|CRISPRCasFinder matches to NC_007336 (Cupriavidus pinatubonensis JMP134 megaplasmid, complete sequence) position: , mismatch: 7, identity: 0.774

ccgaacggctggcgaagcaggtggctggcgt	CRISPR spacer
ccgaacaggtggcgaagcaggtgatgggcca	Protospacer
******.* **************.. ***

32. spacer 1.1|892312|42|NZ_CP029122|CRISPRCasFinder matches to NZ_CP048307 (Escherichia coli strain 9 plasmid p009_C, complete sequence) position: , mismatch: 8, identity: 0.81

acagcagtcggatgcggcgtaaacaccttatctgacctacgt	CRISPR spacer
attgatgtcggatgcggcgtaaacgccttatccgacctacaa	Protospacer
*. *  ******************.*******.*******.

33. spacer 3.6|1310937|32|NZ_CP029122|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 8, identity: 0.75

tcaacgcgctcagacgttgcgtgagtgaacca	CRISPR spacer
acaacgcggtcggacgttgcgtgattaccccg	Protospacer
 ******* **.************ *.  **.

34. spacer 4.4|1333717|31|NZ_CP029122|CRISPRCasFinder matches to NZ_CP017753 (Cupriavidus sp. USMAHM13 plasmid unnamed1, complete sequence) position: , mismatch: 8, identity: 0.742

cccgtcaccgacgcgcagtggcgctaccgtg	CRISPR spacer
gacgtcaccgacgcgcagtcgcgcttcttca	Protospacer
  ***************** ***** *. ..

35. spacer 4.7|1333900|31|NZ_CP029122|CRISPRCasFinder matches to NZ_CP036297 (Planctomycetes bacterium Pla86 plasmid pPla86_1, complete sequence) position: , mismatch: 8, identity: 0.742

ccgaacggctggcgaagcaggtggctggcgt	CRISPR spacer
agcggcagctggcgatgcaggtggcttgcgt	Protospacer
   ..*.******** ********** ****

36. spacer 4.7|1333900|31|NZ_CP029122|CRISPRCasFinder matches to NZ_CP036288 (Planctomycetes bacterium Pla133 plasmid pPla133_1, complete sequence) position: , mismatch: 8, identity: 0.742

ccgaacggctggcgaagcaggtggctggcgt	CRISPR spacer
agcggcagctggcgatgcaggtggcttgcgt	Protospacer
   ..*.******** ********** ****

37. spacer 4.7|1333900|31|NZ_CP029122|CRISPRCasFinder matches to NZ_CP015882 (Ensifer adhaerens strain Casida A plasmid pCasidaAB, complete sequence) position: , mismatch: 8, identity: 0.742

ccgaacggctggcgaagcaggtggctggcgt	CRISPR spacer
ttgcgcagctggcgcagcaggtggctgccga	Protospacer
..* .*.******* ************ **

38. spacer 4.7|1333900|31|NZ_CP029122|CRISPRCasFinder matches to NZ_CP017750 (Cupriavidus sp. USMAA2-4 plasmid unnamed1, complete sequence) position: , mismatch: 8, identity: 0.742

ccgaacggctggcgaagcaggtggctggcgt	CRISPR spacer
gggtacggctggcgaaggaggcggctgcgga	Protospacer
  * ************* ***.*****  *

39. spacer 4.10|1333533|33|NZ_CP029122|PILER-CR matches to NC_007336 (Cupriavidus pinatubonensis JMP134 megaplasmid, complete sequence) position: , mismatch: 8, identity: 0.758

gttgcccgcgcaattccgggagcatccgcaatt	CRISPR spacer
gtccctatcgcaatgccggcagcatccgcaatc	Protospacer
**. *.  ****** **** ************.

40. spacer 4.16|1333899|33|NZ_CP029122|PILER-CR matches to NC_007336 (Cupriavidus pinatubonensis JMP134 megaplasmid, complete sequence) position: , mismatch: 8, identity: 0.758

gccgaacggctggcgaagcaggtggctggcgta	CRISPR spacer
gccgaacaggtggcgaagcaggtgatgggccag	Protospacer
*******.* **************.. ***  .

41. spacer 4.19|1333534|32|NZ_CP029122|CRT matches to NC_007336 (Cupriavidus pinatubonensis JMP134 megaplasmid, complete sequence) position: , mismatch: 8, identity: 0.75

ttgcccgcgcaattccgggagcatccgcaatt	CRISPR spacer
tccctatcgcaatgccggcagcatccgcaatc	Protospacer
*. *.  ****** **** ************.

42. spacer 4.19|1333534|32|NZ_CP029122|CRT matches to NZ_CP013104 (Paraburkholderia caribensis strain MWAP64 plasmid 1, complete sequence) position: , mismatch: 8, identity: 0.75

ttgcccgcgcaattccgggagcatccgcaatt	CRISPR spacer
ttgcgcgcgcaattccgtgagcagcgccatca	Protospacer
**** ************ ***** *  ** .

43. spacer 4.19|1333534|32|NZ_CP029122|CRT matches to NZ_CP012748 (Paraburkholderia caribensis MBA4 plasmid unnamed, complete sequence) position: , mismatch: 8, identity: 0.75

ttgcccgcgcaattccgggagcatccgcaatt	CRISPR spacer
ttgcgcgcgcaattccgtgagcagcgccatca	Protospacer
**** ************ ***** *  ** .

44. spacer 4.19|1333534|32|NZ_CP029122|CRT matches to NC_008759 (Polaromonas naphthalenivorans CJ2 plasmid pPNAP03, complete sequence) position: , mismatch: 8, identity: 0.75

ttgcccgcg-----caattccgggagcatccgcaatt	CRISPR spacer
-----cgtgaaactcatttccgggagcatccgcattt	Protospacer
     **.*     ** ***************** **

45. spacer 4.22|1333717|32|NZ_CP029122|CRT matches to NZ_CP034185 (Deinococcus sp. S14-83 strain S14-83T plasmid unnamed1, complete sequence) position: , mismatch: 8, identity: 0.75

cccgtcaccgacgcgcagtggcgctaccgtga	CRISPR spacer
agcgtcaccgacgcgcagggccgctaccaact	Protospacer
  **************** * *******.

46. spacer 4.22|1333717|32|NZ_CP029122|CRT matches to NZ_CP017753 (Cupriavidus sp. USMAHM13 plasmid unnamed1, complete sequence) position: , mismatch: 8, identity: 0.75

cccgtcaccgacgcgcagtggcgctaccgtga	CRISPR spacer
gacgtcaccgacgcgcagtcgcgcttcttcaa	Protospacer
  ***************** ***** *. ..*

47. spacer 4.25|1333900|32|NZ_CP029122|CRT matches to NZ_CP017750 (Cupriavidus sp. USMAA2-4 plasmid unnamed1, complete sequence) position: , mismatch: 8, identity: 0.75

ccgaacggctggcgaagcaggtggctggcgta	CRISPR spacer
gggtacggctggcgaaggaggcggctgcggaa	Protospacer
  * ************* ***.*****  * *

48. spacer 4.25|1333900|32|NZ_CP029122|CRT matches to NC_007336 (Cupriavidus pinatubonensis JMP134 megaplasmid, complete sequence) position: , mismatch: 8, identity: 0.75

ccgaacggctggcgaagcaggtggctggcgta	CRISPR spacer
ccgaacaggtggcgaagcaggtgatgggccag	Protospacer
******.* **************.. ***  .

49. spacer 4.26|1333961|32|NZ_CP029122|CRT matches to NZ_CP006991 (Rhizobium sp. IE4771 plasmid pRetIE4771e, complete sequence) position: , mismatch: 8, identity: 0.75

gtttaccgccccgcagaggcgctggcagatcc	CRISPR spacer
catcatcctcccgcagatgcgctggccgatcc	Protospacer
  *.*.* .******** ******** *****

50. spacer 1.1|892312|42|NZ_CP029122|CRISPRCasFinder matches to NZ_CP048307 (Escherichia coli strain 9 plasmid p009_C, complete sequence) position: , mismatch: 9, identity: 0.786

acagcagtcggatgcggcgtaaacaccttatctgacctacgt	CRISPR spacer
gttgatgtcggatgcggcgtaaacgccttatccgacctacaa	Protospacer
.. *  ******************.*******.*******.

51. spacer 4.1|1333534|31|NZ_CP029122|CRISPRCasFinder matches to NC_011987 (Agrobacterium radiobacter K84 plasmid pAtK84c, complete sequence) position: , mismatch: 9, identity: 0.71

ttgcccgcgcaattccgggagcatccgcaat	CRISPR spacer
gctaccgcgcaattcgaggagcatccgctgg	Protospacer
 .  *********** .*********** .

52. spacer 4.2|1333595|31|NZ_CP029122|CRISPRCasFinder matches to CP011075 (Brevibacillus laterosporus strain B9 plasmid unnamed1, complete sequence) position: , mismatch: 9, identity: 0.71

acggacaaaatatatattgatttgcgaatta	CRISPR spacer
tgaggcaaaatatagattgatttccgaaaat	Protospacer
  .*.********* ******** ****

53. spacer 4.2|1333595|31|NZ_CP029122|CRISPRCasFinder matches to GU075905 (Prochlorococcus phage P-HM2, complete genome) position: , mismatch: 9, identity: 0.71

acggacaaaatatatattgatttgcgaatta	CRISPR spacer
acggaaaaattatatattgattttacttctg	Protospacer
***** *** *************     .*.

54. spacer 4.4|1333717|31|NZ_CP029122|CRISPRCasFinder matches to NZ_CP017750 (Cupriavidus sp. USMAA2-4 plasmid unnamed1, complete sequence) position: , mismatch: 9, identity: 0.71

cccgtcaccgacgcgcagtggcgctaccgtg	CRISPR spacer
gacgtcactgacgcgcagtcgcgcttcttca	Protospacer
  ******.********** ***** *. ..

55. spacer 4.4|1333717|31|NZ_CP029122|CRISPRCasFinder matches to NZ_AP022593 (Mycolicibacterium arabiense strain JCM 18538 plasmid pJCM18538, complete sequence) position: , mismatch: 9, identity: 0.71

cccgtcaccgacgcgcagtggcgctaccgtg	CRISPR spacer
gacatcaccgacgcccagtggcgcgacgtcc	Protospacer
  *.********** ********* **  .

56. spacer 4.8|1333961|31|NZ_CP029122|CRISPRCasFinder matches to NZ_CP040723 (Rhodococcus pyridinivorans strain YF3 plasmid unnamed4, complete sequence) position: , mismatch: 9, identity: 0.71

gtttaccgccccgcagaggcgctggcagatc	CRISPR spacer
cgagaccgcctcgccgaggcgctggcagcga	Protospacer
    ******.*** *************

57. spacer 4.10|1333533|33|NZ_CP029122|PILER-CR matches to NC_011987 (Agrobacterium radiobacter K84 plasmid pAtK84c, complete sequence) position: , mismatch: 9, identity: 0.727

-gttgcccgcgcaattccgggagcatccgcaatt	CRISPR spacer
cgcta-ccgcgcaattcgaggagcatccgctggg	Protospacer
 *.*. *********** .*********** .

58. spacer 4.13|1333716|33|NZ_CP029122|PILER-CR matches to NZ_CP034185 (Deinococcus sp. S14-83 strain S14-83T plasmid unnamed1, complete sequence) position: , mismatch: 9, identity: 0.727

gcccgtcaccgacgcgcagtggcgctaccgtga	CRISPR spacer
cagcgtcaccgacgcgcagggccgctaccaact	Protospacer
   **************** * *******.

59. spacer 4.22|1333717|32|NZ_CP029122|CRT matches to NZ_CP017750 (Cupriavidus sp. USMAA2-4 plasmid unnamed1, complete sequence) position: , mismatch: 9, identity: 0.719

cccgtcaccgacgcgcagtggcgctaccgtga	CRISPR spacer
gacgtcactgacgcgcagtcgcgcttcttcaa	Protospacer
  ******.********** ***** *. ..*

60. spacer 4.25|1333900|32|NZ_CP029122|CRT matches to NZ_CP036297 (Planctomycetes bacterium Pla86 plasmid pPla86_1, complete sequence) position: , mismatch: 9, identity: 0.719

ccgaacggctggcgaagcaggtggctggcgta	CRISPR spacer
agcggcagctggcgatgcaggtggcttgcgtg	Protospacer
   ..*.******** ********** ****.

61. spacer 4.25|1333900|32|NZ_CP029122|CRT matches to NZ_CP036288 (Planctomycetes bacterium Pla133 plasmid pPla133_1, complete sequence) position: , mismatch: 9, identity: 0.719

ccgaacggctggcgaagcaggtggctggcgta	CRISPR spacer
agcggcagctggcgatgcaggtggcttgcgtg	Protospacer
   ..*.******** ********** ****.

62. spacer 4.25|1333900|32|NZ_CP029122|CRT matches to NZ_CP015882 (Ensifer adhaerens strain Casida A plasmid pCasidaAB, complete sequence) position: , mismatch: 9, identity: 0.719

ccgaacggctggcgaagcaggtggctggcgta	CRISPR spacer
ttgcgcagctggcgcagcaggtggctgccgag	Protospacer
..* .*.******* ************ ** .

63. spacer 4.26|1333961|32|NZ_CP029122|CRT matches to NZ_CP040723 (Rhodococcus pyridinivorans strain YF3 plasmid unnamed4, complete sequence) position: , mismatch: 9, identity: 0.719

gtttaccgccccgcagaggcgctggcagatcc	CRISPR spacer
cgagaccgcctcgccgaggcgctggcagcgac	Protospacer
    ******.*** *************   *

64. spacer 3.1|1310632|32|NZ_CP029122|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP030933 (Enterococcus gilvus strain CR1 plasmid pCR1A, complete sequence) position: , mismatch: 10, identity: 0.688

tccacgctgtaacggccatcattaagtttagt	CRISPR spacer
ccgctgctgtgacgcccatcattaagttactc	Protospacer
.*  .*****.*** *************   .

65. spacer 4.11|1333594|33|NZ_CP029122|PILER-CR matches to GU075905 (Prochlorococcus phage P-HM2, complete genome) position: , mismatch: 10, identity: 0.697

gacggacaaaatatatattgatttgcgaattat	CRISPR spacer
gacggaaaaattatatattgattttacttctgg	Protospacer
****** *** *************     .*.

66. spacer 4.16|1333899|33|NZ_CP029122|PILER-CR matches to NZ_CP036297 (Planctomycetes bacterium Pla86 plasmid pPla86_1, complete sequence) position: , mismatch: 10, identity: 0.697

gccgaacggctggcgaagcaggtggctggcgta	CRISPR spacer
cagcggcagctggcgatgcaggtggcttgcgtg	Protospacer
    ..*.******** ********** ****.

67. spacer 4.16|1333899|33|NZ_CP029122|PILER-CR matches to NZ_CP036288 (Planctomycetes bacterium Pla133 plasmid pPla133_1, complete sequence) position: , mismatch: 10, identity: 0.697

gccgaacggctggcgaagcaggtggctggcgta	CRISPR spacer
cagcggcagctggcgatgcaggtggcttgcgtg	Protospacer
    ..*.******** ********** ****.

68. spacer 4.17|1333960|33|NZ_CP029122|PILER-CR matches to NZ_CP040723 (Rhodococcus pyridinivorans strain YF3 plasmid unnamed4, complete sequence) position: , mismatch: 10, identity: 0.697

ggtttaccgccccgcagaggcgctggcagatcc	CRISPR spacer
ccgagaccgcctcgccgaggcgctggcagcgac	Protospacer
     ******.*** *************   *

69. spacer 4.19|1333534|32|NZ_CP029122|CRT matches to NC_011987 (Agrobacterium radiobacter K84 plasmid pAtK84c, complete sequence) position: , mismatch: 10, identity: 0.688

ttgcccgcgcaattccgggagcatccgcaatt	CRISPR spacer
gctaccgcgcaattcgaggagcatccgctggg	Protospacer
 .  *********** .*********** .

70. spacer 4.20|1333595|32|NZ_CP029122|CRT matches to CP011075 (Brevibacillus laterosporus strain B9 plasmid unnamed1, complete sequence) position: , mismatch: 10, identity: 0.688

acggacaaaatatatattgatttgcgaattat	CRISPR spacer
tgaggcaaaatatagattgatttccgaaaata	Protospacer
  .*.********* ******** ****

71. spacer 4.20|1333595|32|NZ_CP029122|CRT matches to GU075905 (Prochlorococcus phage P-HM2, complete genome) position: , mismatch: 10, identity: 0.688

acggacaaaatatatattgatttgcgaattat	CRISPR spacer
acggaaaaattatatattgattttacttctgg	Protospacer
***** *** *************     .*.

72. spacer 4.22|1333717|32|NZ_CP029122|CRT matches to NZ_AP022593 (Mycolicibacterium arabiense strain JCM 18538 plasmid pJCM18538, complete sequence) position: , mismatch: 10, identity: 0.688

cccgtcaccgacgcgcagtggcgctaccgtga	CRISPR spacer
gacatcaccgacgcccagtggcgcgacgtccc	Protospacer
  *.********** ********* **  .

Prophage detection

Region

Region Position

Protein_number

Hit_taxonomy

Key_proteins

Att_site

Prophage annotation

DBSCAN-SWA_1

1347549 : 1354689

Escherichia_phage(83.33%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_001278994.1\|1347549_1348188_-	aldolase	A0A077SK32	Escherichia_phage	1.4e-82	75.0
WP_000590392.1\|1348184_1349447_-	3-oxo-tetronate kinase	A0A077SLJ7	Escherichia_phage	1.3e-135	61.4
WP_000847985.1\|1349443_1350352_-	NAD(P)-dependent oxidoreductase	A0A077SLF7	Escherichia_phage	3.0e-118	76.9
WP_001272549.1\|1350517_1351315_+	DeoR/GlpR transcriptional regulator	A0A077SK06	Escherichia_phage	5.9e-70	56.3
WP_001141340.1\|1351365_1352022_-	protein-serine/threonine phosphatase	A0A222YWF0	Escherichia_phage	8.0e-49	46.3
WP_001272924.1\|1352127_1354689_-	DNA mismatch repair protein MutS	E3T5Q7	Cafeteria_roenbergensis_virus	1.7e-30	20.6

DBSCAN-SWA_2

1965040 : 1974482

Enterobacteria_phage(85.71%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_000569325.1\|1965040_1965967_+	glycine betaine ABC transporter ATP binding protein YehX	F2Y1V5	Organic_Lake_phycodnavirus	2.0e-08	26.8
WP_000783120.1\|1965971_1966703_+	glycine betaine ABC transporter permease YehW	NA	NA	NA	NA
WP_001216963.1\|1966683_1966791_-	protein YohO	NA	NA	NA	NA
WP_001240401.1\|1966850_1967582_-	HTH-type transcriptional regulator MlrA	Q9EYF2	Enterobacteria_phage	9.7e-112	99.5
WP_001295431.1\|1967803_1969489_+	two-component regulatory system sensor histidine kinase BtsS	Q9EYF3	Enterobacteria_phage	2.5e-304	99.6
WP_000598641.1\|1969485_1970205_+	two-component system response regulator BtsR	NA	NA	NA	NA
WP_001295430.1\|1970251_1970722_+	DUF1456 family protein	Q9EYF4	Enterobacteria_phage	1.8e-82	100.0
WP_024176190.1\|1970762_1971224_-	YehR family lipoprotein	Q9EYF5	Enterobacteria_phage	7.1e-76	99.3
WP_001317947.1\|1971348_1973349_-	hypothetical protein	Q9EYF6	Enterobacteria_phage	0.0e+00	96.1
WP_001292774.1\|1973345_1974482_-	VWA domain-containing protein	Q9EYF7	Enterobacteria_phage	1.1e-162	97.7

DBSCAN-SWA_3

2543045 : 2571648

Escherichia_phage(25.0%)

lysis,integrase,tail

attL 2544110:2544124|attR 2567888:2567902

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_000041556.1\|2543045_2545472_-	dimethyl sulfoxide reductase subunit A	A0A077SK27	Escherichia_phage	7.7e-214	49.0
2544110:2544124	attL	NA	NA	NA	NA
WP_001307224.1\|2545670_2545976_-	DUF1161 domain-containing protein	NA	NA	NA	NA
WP_001321287.1\|2546083_2546794_+	YnfC family lipoprotein	NA	NA	NA	NA
WP_001138581.1\|2546796_2547357_-	spermidine N1-acetyltransferase	NA	NA	NA	NA
WP_000705211.1\|2547391_2547733_-	DUF1283 family protein	NA	NA	NA	NA
WP_000598292.1\|2547867_2548194_+	YnfA family protein	A0A218MNG8	uncultured_virus	9.9e-24	55.6
WP_001295394.1\|2548399_2549614_+	starvation-sensing protein RspA	Q6A202	Oenococcus_phage	1.4e-46	29.0
WP_000836058.1\|2549625_2550645_+	Zn-dependent oxidoreductase	E3SJ82	Synechococcus_phage	4.3e-17	26.2
WP_001360138.1\|2550702_2550813_+	hypothetical protein	NA	NA	NA	NA
WP_000877001.1\|2550832_2552113_-\|integrase	site-specific integrase	B6DZ48	Enterobacteria_phage	6.6e-156	62.3
WP_001296941.1\|2552147_2552384_-	excisionase family protein	S4TND0	Salmonella_phage	6.1e-15	50.7
WP_001372999.1\|2552471_2554943_-	exonuclease	K7PLW7	Enterobacteria_phage	6.1e-57	59.8
WP_001083281.1\|2555036_2555228_-\|lysis	lysis protein YdfD	NA	NA	NA	NA
WP_000854559.1\|2555224_2555413_-	cell division inhibition protein DicB	NA	NA	NA	NA
WP_072163420.1\|2555496_2555739_+	hypothetical protein	NA	NA	NA	NA
WP_000054501.1\|2555719_2556685_+	hypothetical protein	U5P0A0	Shigella_phage	9.7e-59	63.9
WP_001373616.1\|2556725_2557148_+	DUF977 family protein	A0A0U2QQN3	Escherichia_phage	2.0e-61	85.6
WP_001678528.1\|2557277_2558222_-	hypothetical protein	NA	NA	NA	NA
WP_001678529.1\|2558769_2560119_-	hypothetical protein	A0A1W6JNS5	Morganella_phage	5.7e-259	98.0
WP_023147793.1\|2560436_2561039_+\|integrase	tyrosine-type recombinase/integrase	A0A1V0E036	Clostridioides_phage	3.7e-08	31.2
WP_023147794.1\|2561398_2562379_+	hypothetical protein	NA	NA	NA	NA
WP_122083109.1\|2562898_2563006_-	hypothetical protein	Q7Y2Q9	Escherichia_phage	3.8e-09	100.0
WP_001013632.1\|2563050_2563263_+	type I toxin-antitoxin system Hok family toxin	A0A0U2QV81	Escherichia_phage	2.0e-25	95.4
WP_000980999.1\|2563478_2563730_+	hypothetical protein	NA	NA	NA	NA
WP_023147795.1\|2563796_2564075_+	hypothetical protein	I6PCV7	Cronobacter_phage	7.4e-12	48.4
WP_001373319.1\|2564076_2565126_+	DUF968 domain-containing protein	U5P0K4	Shigella_phage	4.2e-108	54.3
WP_000904112.1\|2565138_2565513_+	RusA family crossover junction endodeoxyribonuclease	V5URS4	Shigella_phage	8.4e-35	62.7
WP_000762889.1\|2565509_2566331_+	antitermination protein	K7P7B9	Enterobacteria_phage	2.7e-78	59.0
WP_001373320.1\|2567076_2569239_+	DUF1983 domain-containing protein	A0A291AWT4	Escherichia_phage	0.0e+00	96.6
2567888:2567902	attR	NA	NA	NA	NA
WP_032181053.1\|2570070_2571468_+	chaperone of endosialidase	K7PGT9	Enterobacteria_phage	1.4e-204	85.2
WP_072163404.1\|2571522_2571648_+\|tail	phage tail protein	K7PMH7	Enterobacteria_phage	1.5e-12	82.5

DBSCAN-SWA_4

2973073 : 2983851

Enterobacteria_phage(40.0%)

integrase

attL 2971046:2971069|attR 2982554:2982577

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
2971046:2971069	attL	NA	NA	NA	NA
WP_000379042.1\|2973073_2975029_-	AAA domain-containing protein	K4I1H4	Acidithiobacillus_phage	7.5e-26	28.6
WP_001753331.1\|2977393_2977933_-	hypothetical protein	M9NZI6	Enterobacteria_phage	7.5e-61	65.6
WP_072163463.1\|2978115_2978427_+	recombinase	A0A0N7KZJ3	Stx2-converting_phage	2.4e-43	100.0
WP_001372461.1\|2978423_2979104_+	YqaJ viral recombinase family protein	A0A0P0ZCD4	Stx2-converting_phage	5.1e-131	98.7
WP_000149533.1\|2979100_2979259_+	DUF1317 family protein	M1FJ61	Enterobacteria_phage	6.4e-21	88.5
WP_001678641.1\|2979255_2980320_+	DGQHR domain-containing protein	T1SBJ4	Salmonella_phage	1.7e-133	64.8
WP_001678640.1\|2980473_2980692_+	TraR/DksA family transcriptional regulator	M1FQT7	Enterobacteria_phage	3.2e-34	94.4
WP_000488406.1\|2980739_2980979_+	DUF4222 domain-containing protein	M1FPC8	Enterobacteria_phage	3.9e-38	94.9
WP_000088653.1\|2981118_2981355_+	excisionase	NA	NA	NA	NA
WP_000741339.1\|2981344_2982487_+\|integrase	tyrosine-type recombinase/integrase	O21929	Phage_21	8.1e-206	99.7
WP_000444487.1\|2982600_2983851_-	NADP-dependent isocitrate dehydrogenase	Q77Z09	Phage_21	3.8e-23	100.0
2982554:2982577	attR	NA	NA	NA	NA

DBSCAN-SWA_5

3298227 : 3306997

Salmonella_phage(90.0%)

integrase

attL 3297897:3297910|attR 3307039:3307052

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
3297897:3297910	attL	NA	NA	NA	NA
WP_001376441.1\|3298227_3298416_-	hypothetical protein	A0A1S6L006	Salmonella_phage	2.0e-24	95.2
WP_001376443.1\|3298574_3300968_-	replication endonuclease	E5G6L9	Salmonella_phage	0.0e+00	93.7
WP_001544405.1\|3300964_3301822_-	DNA adenine methylase	E5G6L8	Salmonella_phage	9.5e-159	95.8
WP_000752610.1\|3301818_3302046_-	TraR/DksA family transcriptional regulator	E5G6L7	Salmonella_phage	7.8e-36	98.7
WP_001244224.1\|3302045_3302279_-	DUF2732 family protein	E5G6L6	Salmonella_phage	1.9e-32	97.4
WP_000996717.1\|3302346_3302688_-	DUF5347 domain-containing protein	E5G6L5	Salmonella_phage	1.7e-55	98.2
WP_000956192.1\|3302805_3303102_-	DUF2724 domain-containing protein	E5G6L4	Salmonella_phage	1.9e-21	88.5
WP_000460892.1\|3303109_3303619_-	phage regulatory CII family protein	E5G6L3	Salmonella_phage	1.3e-86	98.2
WP_000188448.1\|3303651_3303873_-	hypothetical protein	NA	NA	NA	NA
WP_001680871.1\|3304018_3304897_+	phage repressor protein CI	A0A1S6KZZ7	Salmonella_phage	1.7e-30	39.4
WP_001678408.1\|3304908_3305853_+	hypothetical protein	NA	NA	NA	NA
WP_001372563.1\|3305944_3306997_+\|integrase	tyrosine-type recombinase/integrase	A0A218M4I3	Erwinia_phage	1.4e-106	57.0
3307039:3307052	attR	NA	NA	NA	NA

DBSCAN-SWA_6

3386580 : 3412836

Enterobacteria_phage(46.88%)

lysis,integrase,tail

attL 3388496:3388510|attR 3412910:3412924

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_001356070.1\|3386580_3387870_+	adenosylmethionine--8-amino-7-oxononanoate transaminase	A0A1V0SKB7	Klosneuvirus	3.4e-19	27.1
WP_000767389.1\|3387928_3388405_+	kinase inhibitor	NA	NA	NA	NA
3388496:3388510	attL	NA	NA	NA	NA
WP_001753290.1\|3389150_3390482_+	GGDEF domain-containing protein	A0A127AWB9	Bacillus_phage	1.4e-20	37.1
WP_072163407.1\|3390555_3390732_-\|tail	phage tail protein	K7PMH7	Enterobacteria_phage	9.4e-21	84.5
WP_000239881.1\|3390881_3391550_+	class I SAM-dependent methyltransferase	NA	NA	NA	NA
WP_001372490.1\|3392440_3393001_-	DNA-packaging protein	A0A0K2FIG2	Enterobacteria_phage	4.9e-87	98.8
WP_000105084.1\|3393389_3393623_+	YlcI/YnfO family protein	A0A0K2FIR8	Escherichia_phage	7.3e-21	94.4
WP_000079508.1\|3393679_3394090_+	DUF1398 family protein	C6ZCX4	Enterobacteria_phage	1.3e-52	76.3
WP_001139678.1\|3394441_3394594_-	hypothetical protein	K7PKL2	Enterobacteria_phage	3.1e-20	96.0
WP_001228702.1\|3394622_3394829_-	hypothetical protein	H6WRZ6	Salmonella_phage	5.3e-31	98.5
WP_001372488.1\|3395045_3395543_-	lysozyme RrrD	A0A1B5FP97	Escherichia_phage	1.6e-89	97.0
WP_000839582.1\|3395542_3395758_-\|lysis	phage lysis protein EssD	A5LH82	Enterobacteria_phage	1.2e-33	98.6
WP_000592543.1\|3397027_3397987_-	DUF523 and DUF1722 domain-containing protein	NA	NA	NA	NA
WP_000780581.1\|3398179_3398704_+	lipocalin family protein	A0A1W6JNX6	Morganella_phage	1.1e-48	54.1
WP_001204777.1\|3398859_3399237_-	antitermination protein	Q777W5	Enterobacteria_phage	7.3e-55	84.2
WP_000971068.1\|3399322_3399463_-	YlcG family protein	K7PHH3	Enterobacteria_phage	5.5e-08	67.4
WP_001372483.1\|3399459_3399822_-	crossover junction endodeoxyribonuclease RusA	K7PM48	Enterobacteria_phage	1.5e-60	97.4
WP_001372487.1\|3399818_3400109_-	DUF1364 domain-containing protein	K7PGZ6	Enterobacteria_phage	4.8e-46	91.7
WP_000224914.1\|3400101_3400272_-	hypothetical protein	K7P7K0	Enterobacteria_phage	2.4e-13	69.8
WP_001372486.1\|3400271_3400727_-	DNA base-flipping protein YbcN	I6PD71	Cronobacter_phage	5.9e-59	66.2
WP_072157016.1\|3400723_3400825_-	hypothetical protein	NA	NA	NA	NA
WP_000825400.1\|3400917_3401370_-	hypothetical protein	NA	NA	NA	NA
WP_000720581.1\|3401366_3401927_-	hypothetical protein	NA	NA	NA	NA
WP_000145917.1\|3402411_3402705_-	protein ren	A0A0N6WES4	Escherichia_phage	1.1e-42	95.7
WP_001182899.1\|3403467_3404007_-	hypothetical protein	M9NZI6	Enterobacteria_phage	2.0e-61	66.1
WP_001067458.1\|3404076_3404307_-	helix-turn-helix domain-containing protein	A0A2H4FNF3	Salmonella_phage	1.5e-21	68.0
WP_000259990.1\|3404345_3405101_+	helix-turn-helix transcriptional regulator	Q76H56	Enterobacteria_phage	1.4e-92	75.0
WP_000389051.1\|3405223_3405973_+	hypothetical protein	NA	NA	NA	NA
WP_000210934.1\|3405969_3406797_+	DUF3037 domain-containing protein	NA	NA	NA	NA
WP_000233576.1\|3407305_3407512_+	phage encoded cell division inhibitor protein	K7P6H3	Enterobacteria_phage	3.2e-28	85.3
WP_000995439.1\|3407587_3407884_+	host-nuclease inhibitor protein Gam	A0A1I9LJN1	Stx_converting_phage	1.6e-49	100.0
WP_000100847.1\|3407889_3408675_+	phage recombination protein Bet	A0A1I9LJN0	Stx_converting_phage	6.3e-149	100.0
WP_001372450.1\|3408671_3409352_+	YqaJ viral recombinase family protein	A0A0P0ZCD4	Stx2-converting_phage	3.0e-131	98.7
WP_072126246.1\|3409348_3409531_+	DUF1317 domain-containing protein	A0A0N7CHV0	Escherichia_phage	2.2e-28	98.3
WP_023148020.1\|3409503_3409695_+	DUF1382 family protein	A0A0P0ZC67	Stx2-converting_phage	2.8e-26	98.4
WP_001395510.1\|3409705_3409987_+	cell division protein ZapA	A0A0P0ZE02	Stx2-converting_phage	2.5e-47	100.0
WP_000763365.1\|3410085_3410307_+	TraR/DksA family transcriptional regulator	A0A0N7C211	Escherichia_phage	1.4e-34	97.3
WP_000120065.1\|3410517_3411120_-	hypothetical protein	NA	NA	NA	NA
WP_000545745.1\|3411362_3411530_+	hypothetical protein	A5VWB7	Enterobacteria_phage	2.9e-27	98.2
WP_001303849.1\|3411569_3411788_+	excisionase	Q77WA4	Escherichia_phage	3.7e-35	100.0
WP_000533646.1\|3411765_3412836_+\|integrase	tyrosine-type recombinase/integrase	Q9MCR4	Enterobacteria_phage	1.9e-201	99.7
3412910:3412924	attR	NA	NA	NA	NA

DBSCAN-SWA_7

4197341 : 4218730

Escherichia_phage(56.0%)

integrase,tail

attL 4198867:4198886|attR 4218961:4218980

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_000202566.1\|4197341_4198928_-	peptide chain release factor 3	D0R0F5	Streptococcus_phage	5.3e-30	24.9
4198867:4198886	attL	NA	NA	NA	NA
WP_001378647.1\|4199480_4199777_+	hypothetical protein	A0A291AWW6	Escherichia_phage	6.8e-48	99.0
WP_001378643.1\|4200112_4200616_-	hypothetical protein	A0A291AWW1	Escherichia_phage	1.1e-90	100.0
WP_001171282.1\|4201571_4202534_+	hypothetical protein	A0A0A7NV63	Enterobacteria_phage	4.0e-174	91.1
WP_001681074.1\|4202537_4203065_+\|tail	tail fiber assembly protein	A0A077SK10	Escherichia_phage	1.9e-93	98.3
WP_000972143.1\|4203093_4203627_-\|tail	tail fiber assembly protein	C9DGR0	Escherichia_phage	6.4e-97	99.4
WP_000217632.1\|4204483_4204909_-	hypothetical protein	A0A291AWZ9	Escherichia_phage	3.6e-74	100.0
WP_001047105.1\|4205189_4205942_-	antitermination protein	A0A291AWZ5	Escherichia_phage	1.3e-138	100.0
WP_001360050.1\|4205955_4206945_-	DUF968 domain-containing protein	A0A291AWV9	Escherichia_phage	1.5e-195	100.0
WP_108711101.1\|4206952_4207309_-	hypothetical protein	A0A291AX14	Escherichia_phage	2.0e-33	95.9
WP_000210170.1\|4207305_4207632_-	LexA family transcriptional regulator	A0A291AWY9	Escherichia_phage	5.4e-54	100.0
WP_001373594.1\|4207631_4208126_-	PerC family transcriptional regulator	A0A291AWV6	Escherichia_phage	3.9e-88	100.0
WP_001677149.1\|4208122_4208941_-	helix-turn-helix domain-containing protein	Q8SBF1	Shigella_phage	1.8e-122	100.0
WP_001446924.1\|4208937_4209162_-	hypothetical protein	A0A291AX25	Escherichia_phage	7.0e-37	98.6
WP_001446923.1\|4209166_4210003_-	Immunity region from phage	A0A291AWU3	Escherichia_phage	1.0e-152	100.0
WP_000521508.1\|4209999_4210551_-	hypothetical protein	A0A291AWW8	Escherichia_phage	4.5e-101	100.0
WP_000649477.1\|4210594_4210795_-	transcriptional regulator	U5P445	Shigella_phage	7.9e-32	100.0
WP_000848748.1\|4210885_4211560_+	LexA family transcriptional repressor	U5P0T5	Shigella_phage	1.2e-132	100.0
WP_000135682.1\|4212226_4212589_+	hypothetical protein	U5P4J6	Shigella_phage	3.3e-60	100.0
WP_001763729.1\|4212654_4213479_+	DUF2303 family protein	U5P439	Shigella_phage	1.7e-149	99.6
WP_001401560.1\|4213607_4214144_+	5'-deoxynucleotidase	K7PKJ9	Enterobacteria_phage	2.2e-100	99.4
WP_001242749.1\|4214134_4214497_+	phage protein	U5P092	Shigella_phage	2.1e-67	100.0
WP_001377405.1\|4214496_4215117_+	DUF551 domain-containing protein	A5LH60	Enterobacteria_phage	1.2e-113	91.7
WP_001419254.1\|4215549_4217250_-	AIPR family protein	D0UIM0	Aggregatibacter_phage	4.0e-07	27.6
WP_001680166.1\|4217506_4218730_-\|integrase	site-specific integrase	A0A291AWU1	Escherichia_phage	7.6e-234	98.8
4218961:4218980	attR	NA	NA	NA	NA

DBSCAN-SWA_8

4307036 : 4313595

uncultured_Caudovirales_phage(16.67%)

transposase

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_000684856.1\|4307036_4307993_+	Fe(3+) dicitrate ABC transporter permease subunit FecD	A0A2H4IY97	uncultured_Caudovirales_phage	1.1e-17	26.1
WP_000175457.1\|4307993_4308761_+	Fe(3+) dicitrate ABC transporter ATP-binding protein FecE	G3M9Y6	Bacillus_virus	6.4e-13	24.8
WP_000177060.1\|4309318_4309576_-	hypothetical protein	NA	NA	NA	NA
WP_001254876.1\|4310627_4311779_+\|transposase	IS30-like element IS30 family transposase	W5R8L2	Staphylococcus_phage	2.6e-42	36.0
WP_000747102.1\|4311698_4312049_-\|transposase	transposase	Q716C1	Shigella_phage	8.9e-39	97.7
WP_000227281.1\|4312149_4312722_+	hypothetical protein	Q858R9	Enterobacteria_phage	2.2e-71	69.0
WP_000594911.1\|4312770_4313595_-	hypothetical protein	L7TR00	Rhizobium_phage	3.0e-16	35.5

DBSCAN-SWA_9

4557435 : 4580852

Shigella_phage(36.0%)

lysis,integrase

attL 4548700:4548713|attR 4567418:4567431

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
4548700:4548713	attL	NA	NA	NA	NA
WP_000332259.1\|4557435_4558533_+\|integrase	site-specific integrase	S5MDN5	Escherichia_phage	1.8e-210	99.2
WP_001217553.1\|4558593_4558842_+	DinI family protein	K7PLW4	Enterobacteria_phage	1.8e-38	100.0
WP_000543834.1\|4559064_4559616_+	SLATT domain-containing protein	NA	NA	NA	NA
WP_001678535.1\|4559593_4560964_+	reverse transcriptase	NA	NA	NA	NA
WP_001753753.1\|4561401_4563555_-	chaperone of endosialidase	K7PGT9	Enterobacteria_phage	1.4e-211	53.6
WP_000839596.1\|4564805_4565021_-\|lysis	phage lysis protein EssD	A5LH82	Enterobacteria_phage	9.0e-34	100.0
WP_000799656.1\|4565088_4566141_-	site-specific DNA-methyltransferase	A5LH81	Enterobacteria_phage	2.7e-208	100.0
WP_001355891.1\|4566290_4566485_-	hypothetical protein	Q8SBE3	Shigella_phage	1.8e-28	100.0
WP_046657263.1\|4566731_4567898_+	nucleoid-associated protein	A0A291AUQ0	Sinorhizobium_phage	1.7e-12	25.3
4567418:4567431	attR	NA	NA	NA	NA
WP_046657265.1\|4567894_4569121_+	hypothetical protein	NA	NA	NA	NA
WP_016159280.1\|4569113_4569458_-	hypothetical protein	A0A0P0ZCW0	Stx2-converting_phage	3.3e-54	84.1
WP_001360050.1\|4569475_4570465_-	DUF968 domain-containing protein	A0A291AWV9	Escherichia_phage	1.5e-195	100.0
WP_001061404.1\|4570472_4571270_-	KilA-N domain-containing protein	A0A0P0ZCS0	Stx2-converting_phage	5.2e-151	100.0
WP_000767133.1\|4571289_4571679_-	RusA family crossover junction endodeoxyribonuclease	A5LH74	Enterobacteria_phage	1.6e-68	99.2
WP_032235543.1\|4571675_4572002_-	LexA family transcriptional regulator	A5LH73	Enterobacteria_phage	6.6e-52	98.1
WP_000066917.1\|4571998_4572652_-	phage N-6-adenine-methyltransferase	A5LH72	Enterobacteria_phage	1.9e-127	99.5
WP_072165319.1\|4572651_4573146_-	PerC family transcriptional regulator	U5P0U0	Shigella_phage	1.9e-87	97.6
WP_021527492.1\|4573142_4573961_-	helix-turn-helix domain-containing protein	Q8SBF1	Shigella_phage	3.1e-122	99.6
WP_001446924.1\|4573957_4574182_-	hypothetical protein	A0A291AX25	Escherichia_phage	7.0e-37	98.6
WP_032181493.1\|4574186_4575023_-	ash family protein	Q8SBF3	Shigella_phage	2.6e-137	91.7
WP_000515860.1\|4575019_4575571_-	hypothetical protein	Q8SBF4	Shigella_phage	7.6e-101	100.0
WP_000649477.1\|4575614_4575815_-	transcriptional regulator	U5P445	Shigella_phage	7.9e-32	100.0
WP_000859462.1\|4575905_4576580_+	LexA family transcriptional repressor	Q8SBF6	Shigella_phage	1.2e-132	100.0
WP_000135682.1\|4577246_4577609_+	hypothetical protein	U5P4J6	Shigella_phage	3.3e-60	100.0
WP_001753751.1\|4577674_4578499_+	DUF2303 family protein	U5P439	Shigella_phage	6.6e-149	99.3
WP_000610754.1\|4578685_4579468_+	hypothetical protein	NA	NA	NA	NA
WP_001093912.1\|4579504_4579774_+	hypothetical protein	S5MQM5	Escherichia_phage	2.5e-41	97.8
WP_000019186.1\|4579807_4580356_-	hypothetical protein	S5M7T3	Escherichia_phage	2.7e-82	89.6
WP_000287252.1\|4580378_4580852_-	SocA family protein	K4NZT7	Burkholderia_phage	2.4e-18	31.8

Anti-CRISPR protein detection

Acr ID	Acr position	Acr size	Homology with known anti	Neighbor HTH/AcRanker	Neighbor Aca	In prophage	Protospacer in prophage

Overview of predicted results

Overview of the results

Cas Category Instructions

Results visualization

1. NZ_CP029123

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection

2. NZ_CP029122

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection