CRISPRimmunity

Please click to download your results

Overview of predicted results

Overview of the results

Contig_ID	Contig_def	CRISPR array number	Contig Signature genes	Target MGE spacer number	Prophage number
CP019581	Lactobacillus helveticus strain LH5, complete genome	3 crisprs	DinG,WYL,cas14k,cas14j,DEDDh,Cas14u_CAS-V,cas3,RT,csa3,cas2,cas5,cas8c,cas7,cas4,cas1	5	2
CP019583	Lactobacillus helveticus strain LH5 plasmid pCBTLH5_2, complete sequence	1 crisprs	NA	1	0
CP019582	Lactobacillus helveticus strain LH5 plasmid pCBTLH5_1, complete sequence	0 crisprs	NA	0	0

Results visualization

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Crispr_ID: CP019581_1

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

CP019581_1

962207-962386

TypeV

Consensus_repeat	Method
ATGTGGGATTTGAACCCACGC	PILER-CR

2 spacers

cas14j

The CRISPR arrays of CP019581_1

>merge|CP019581|1|962207-962386|PILER-CR
ATGTGGGATTCGAACCCACGCATGCTGGATCCACAAACCAGTGTGTTAACCCCTTCACCAATTCCGCCATAAACGGTCCATGTGGGATTTGAACCCACGATCTCCTCCGTGACAGGGAGGCGAGATAAACCACTGCTCCAATGGACCAATCAGAGGAGGATGTGGGATTTGAACCCACGC

>CP019581|1|1|962207-962386|PILER-CR
ATGTGGGATTCGAACCCACGC	ATGCTGGATCCACAAACCAGTGTGTTAACCCCTTCACCAATTCCGCCATAAACGGTCC
ATGTGGGATTTGAACCCACGA	TCTCCTCCGTGACAGGGAGGCGAGATAAACCACTGCTCCAATGGACCAATCAGAGGAGG
ATGTGGGATTTGAACCCACGC

Protein	Signature genes	Signature genes Name	Protein_function
CP019581.1\|AZK91230.1\|954976_955729_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|375122
CP019581.1\|AZK91227.1\|951149_951965_-\|putative-oxidoreductase	unknown	unknown	gnl\|CDD\|381359
CP019581.1\|AZK91235.1\|960072_960585_+\|Bacterial-regulatory-protein,-tetR-family	unknown	unknown	gnl\|CDD\|224228
CP019581.1\|AZK91232.1\|956330_957188_+\|Helix-turn-helix-domain-protein	unknown	unknown	gnl\|CDD\|238045
CP019581.1\|AZK91238.1\|964054_964216_-\|hypothetical-protein	unknown	unknown	unknown
CP019581.1\|AZK91245.1\|970084_970789_+\|Inner-membrane-protein-YbhL	unknown	unknown	gnl\|CDD\|198414
CP019581.1\|AZK91240.1\|965039_965237_+\|Cold-shock-protein-2	unknown	unknown	gnl\|CDD\|224197
CP019581.1\|AZK91243.1\|968149_969526_+\|Na(+)/H(+)-antiporter-NhaC	unknown	unknown	gnl\|CDD\|188097
CP019581.1\|AZK91237.1\|962554_963055_-\|putative-acetyltransferase	unknown	unknown	gnl\|CDD\|366181
CP019581.1\|AZK91236.1\|960592_962059_-\|Multidrug-resistance-protein-3	unknown	unknown	gnl\|CDD\|129794
CP019581.1\|AZK91241.1\|965725_966034_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|376281
CP019581.1\|AZK91242.1\|966434_967787_-\|23S-rRNA-(uracil-C(5))-methyltransferase-RlmCD	unknown	unknown	gnl\|CDD\|225174
CP019581.1\|AZK91231.1\|955816_955945_-\|hypothetical-protein	unknown	unknown	unknown
CP019581.1\|AZK91228.1\|952019_953204_-\|Putative-transposase-DNA-binding-domain-protein	cas14j	-	gnl\|CDD\|223747
CP019581.1\|AZK91244.1\|969562_969877_-\|hypothetical-protein	unknown	unknown	unknown
CP019581.1\|AZK91246.1\|970833_971526_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|377696
CP019581.1\|AZK91233.1\|957252_957690_-\|Putative-acetyltransferase-YjbC	unknown	unknown	gnl\|CDD\|379228
CP019581.1\|AZK91234.1\|958190_959963_-\|Oleate-hydratase	unknown	unknown	gnl\|CDD\|237575
CP019581.1\|AZK91229.1\|953543_954602_-\|S-layer-protein-precursor	unknown	unknown	gnl\|CDD\|367400
CP019581.1\|AZK91239.1\|964396_964825_-\|hypothetical-protein	unknown	unknown	unknown

Protein	Function_ID	Function_description	E-value
CP019581.1\|AZK91230.1\|954976_955729_-\|hypothetical-protein	gnl\|CDD\|375122	pfam17312, Helveticin_J, Bacteriocin helveticin-J. Bacteriocins are biologically active proteins or protein complexes that display a bactericidal mode of action towards closely related species. Bacteriocins produced by lactic acid bacteria are grouped into different classes. Class III of bacteriocins includes large heat liable proteins. Lactobacillus helveticus 481 produces a 37-kDa bacteriocin called helveticin J which is a representative for Clas III bacteriocins.	9.06227e-82
CP019581.1\|AZK91227.1\|951149_951965_-\|putative-oxidoreductase	gnl\|CDD\|381359	cd19133, AKR_AKR5F1, the AKR5F family of aldo-keto reductase (AKR). Klebsiella sp. 2,5-diketo-D-gluconic acid reductase (2,5-DKG reductase) is a founding member of aldo-keto reductase family 5 member F1 (AKR5F1). It catalyzes the reduction of 2,5-diketo-D-gluconic acid (25DKG) to 2-keto-L-gulonic acid (2KLG).	4.27038e-144
CP019581.1\|AZK91235.1\|960072_960585_+\|Bacterial-regulatory-protein,-tetR-family	gnl\|CDD\|224228	COG1309, AcrR, Transcriptional regulator [Transcription].	2.14851e-07
CP019581.1\|AZK91232.1\|956330_957188_+\|Helix-turn-helix-domain-protein	gnl\|CDD\|238045	cd00093, HTH_XRE, Helix-turn-helix XRE-family like proteins. Prokaryotic DNA binding proteins belonging to the xenobiotic response element family of transcriptional regulators.	7.73369e-07
CP019581.1\|AZK91240.1\|965039_965237_+\|Cold-shock-protein-2	gnl\|CDD\|224197	COG1278, CspC, Cold shock proteins [Transcription].	6.6753e-32
CP019581.1\|AZK91245.1\|970084_970789_+\|Inner-membrane-protein-YbhL	gnl\|CDD\|198414	cd10432, BI-1-like_bacterial, Bacterial BAX inhibitor (BI)-1/YccA-like proteins. This family is comprised of bacterial relatives of the mammalian members of the BAX inhibitor (BI)-1 like family of small transmembrane proteins, which have been shown to have an antiapoptotic effect either by stimulating the antiapoptotic function of Bcl-2, a well-characterized oncogene, or by inhibiting the proapoptotic effect of Bax, another member of the Bcl-2 family. In plants, BI-1 like proteins play a role in pathogen resistance. A characterized prokaryotic member, Escherichia coli YccA, has been shown to interact with ATP-dependent protease FtsH, which degrades abnormal membrane proteins as part of a quality control mechanism to keep the integrity of biological membranes.	2.29842e-49
CP019581.1\|AZK91243.1\|968149_969526_+\|Na(+)/H(+)-antiporter-NhaC	gnl\|CDD\|188097	TIGR00931, Uncharacterized_Na+/H+_antiporter_HI_1107, Na+/H+ antiporter NhaC. A single member of the NhaC family, a protein from Bacillus firmus, has been functionally characterized.It is involved in pH homeostasis and sodium extrusion. Members of the NhaC family are found in both Gram-negative bacteria and Gram-positive bacteria. Intriguingly, archaeal homolog ArcD (just outside boundaries of family) has been identified as an arginine/ornithine antiporter. [Transport and binding proteins, Cations and iron carrying compounds].	5.74224e-110
CP019581.1\|AZK91237.1\|962554_963055_-\|putative-acetyltransferase	gnl\|CDD\|366181	pfam00583, Acetyltransf_1, Acetyltransferase (GNAT) family. This family contains proteins with N-acetyltransferase functions such as Elp3-related proteins.	3.72017e-13
CP019581.1\|AZK91236.1\|960592_962059_-\|Multidrug-resistance-protein-3	gnl\|CDD\|129794	TIGR00711, Uncharacterized_MFS-type_transporter_YhcA, drug resistance transporter, EmrB/QacA subfamily. This subfamily of drug efflux proteins, a part of the major faciliator family, is predicted to have 14 potential membrane-spanning regions. Members with known activities include EmrB (multiple drug resistance efflux pump) in E. coli, FarB (antibacterial fatty acid resistance) in Neisseria gonorrhoeae, TcmA (tetracenomycin C resistance) in Streptomyces glaucescens, etc. In most cases, the efflux pump is described as having a second component encoded in the same operon, such as EmrA of E. coli. [Cellular processes, Toxin production and resistance, Transport and binding proteins, Other].	3.26867e-41
CP019581.1\|AZK91241.1\|965725_966034_-\|hypothetical-protein	gnl\|CDD\|376281	pfam18862, ApeA_NTD1, ApeA N-terminal domain 1. Mostly beta strands. Fused to HEPN (Apea). Several conserved aromatic residues, abundant but poorly conserved.	0.00145728
CP019581.1\|AZK91242.1\|966434_967787_-\|23S-rRNA-(uracil-C(5))-methyltransferase-RlmCD	gnl\|CDD\|225174	COG2265, TrmA, SAM-dependent methyltransferases related to tRNA (uracil-5-)-methyltransferase [Translation, ribosomal structure and biogenesis].	9.48258e-160
CP019581.1\|AZK91228.1\|952019_953204_-\|Putative-transposase-DNA-binding-domain-protein	gnl\|CDD\|223747	COG0675, COG0675, Transposase and inactivated derivatives [DNA replication, recombination, and repair].	3.60144e-46
CP019581.1\|AZK91246.1\|970833_971526_-\|hypothetical-protein	gnl\|CDD\|377696	pfam06736, DUF1211, Protein of unknown function (DUF1211). This family represents a conserved region within a number of hypothetical proteins of unknown function found in eukaryotes, bacteria and archaea. These may possibly be integral membrane proteins.	1.00269e-14
CP019581.1\|AZK91233.1\|957252_957690_-\|Putative-acetyltransferase-YjbC	gnl\|CDD\|379228	pfam13508, Acetyltransf_7, Acetyltransferase (GNAT) domain. This domain catalyzes N-acetyltransferase reactions.	6.95366e-07
CP019581.1\|AZK91234.1\|958190_959963_-\|Oleate-hydratase	gnl\|CDD\|237575	PRK13977, PRK13977, myosin-cross-reactive antigen; Provisional.	0
CP019581.1\|AZK91229.1\|953543_954602_-\|S-layer-protein-precursor	gnl\|CDD\|367400	pfam03217, SLAP, SLAP domain. This short domain is found in a variety of bacterial cell surface proteins. The domain is about 60 residues in length (although previously defined as 2 copies of this domain). It usually occurs in tandem pairs. It may be distantly related to the SH3 domain.	1.7437e-07

>CP019581.1|AZK91236.1|960592_962059_-|Multidrug-resistance-protein-3
MNKKQITMVTIALMLGNVMSGLDGTIINTAIPTIVAALHGIQFMGWIVAIFLLGMSISIPIWTKIGEKITNKKAFEISLVLFVLGAALQGMAPNIIFFLCSRFIMGIGAGGMGSLPYIIAGYVFKNIKTRTKVLGYLTASWNGAAILGPLVGGWLIDAFSWHWVFYINIPIGLIALIICFIYYKPVTPEKTPVFDIPGAGLLVIGLLLFLMGVQLVGLTANWIVISLIIISLVFIVLFFIRENHAANPIIPVSLFKNKDLDGDFLLFAFTWGAFIAVNTYMPMWAQALLGLSALLGGMTLIPNSIVEIIASQSVAAIQEHMSTFKLALIGIIAMMISSAGLFLADIHTPVQMLTFIGAFSGIGVGFIFVAMQLKVQLDAGLKNMATATSTSYLIRILAQTVMAAVYGVIMNLNLASGVHTHKGITMAMMNKLSDAKSAKLLPQGLVPTMRTIFHAGIKEIMLVSLILLIIAFVLNFYFNFGKKRKKLQ
>CP019581.1|AZK91235.1|960072_960585_+|Bacterial-regulatory-protein,-tetR-family
MNMKSLHTQQHIEKALFSLLQKKPYAEISIAEITRKAHVSRTSFYRNYSQKNDVLMLFLANQYKKFIVDINEHKLKTLTKQLVAYLTFFKGNPKVMKILLDAGFEGSLLNFQTRYLKKLLSVYHPDLNLPDYAIAYQSGGIYMLLIWWVKQDYATPLEDLINYAEKHIML
>CP019581.1|AZK91234.1|958190_959963_-|Oleate-hydratase
MHYSNGNYEAFVKAEKPKDVDQKSAYIVGSGLAALASAVFLIRDGQMKGNRIHIFEELSLPGGSMDGIYSKEKESYIIRGGREMEPHFECLWDLFRSIPSTEHEGESILDEFYRLNRKDPSYAKTRVIINRGEALPTDGQLLLTPKAVKEIVDLCLTPEKDLQNKKINEVFTKEFFQSNFWLYWSTMFAFEPWASAMEMRRYLMRFVQHVATLKNLSSLRFTKYNQYESLILPMVKYLKSHGVQFHYDTVVDNIFVNRSNGEKVAKQIILTEKGERKTIDLTENDLVFVTNGSITESTTYGDNFHPASEEHELGASWQLWKNLAAQDSDFGHPDVFCKDIPKANWRMSATITFKNDDIVPFIEAVNKKDPHSGSIVTSGPTTIKDSNWLLGYSISRQPHFKAQKPNELIVWLYGLFSDTKGNYVEKTMPDCNGIELCEEWLYHMGVPEERIPEMAAAATTIPAHMPYITSYFMPRALGDRPKVVPDHSKNLAFIGNFAETPRDTVFTTEYSVRTAMEAVYTLLDIDRGVPEVFASAFDVRMLMNALYYLNDQKKLEDLDLPMGEKLAIKGMLKKVKGTYIEELMKEYKLI
>CP019581.1|AZK91233.1|957252_957690_-|Putative-acetyltransferase-YjbC
MFSLLAMSLHRNVKFHAIYNEDQFCGITYYAENDKTVYLTYLAINEELRGQGYGSKILTMLEDRFLDKQIVIDIEPVTSKAKNYKQRVSRLKFYKRNGFHRTDQKLKDPDGEFEALTTGKKLDKESFIDTLRQMSFGFYQAKVEK
>CP019581.1|AZK91232.1|956330_957188_+|Helix-turn-helix-domain-protein
MIKNIYGAKFRELRKQQNITLTKAAKGITSKSTLSLWENGKDNLSFNQVLELLKHIHTQPIEFIENIISSDLLSLSEKIHLAYVASDTVTLHRYVIKKRELSKKHPQNNDIFLEYCFTCMFYQDLSSDNIFTKYDKIRLTNILTNISEWNYKNIFYFGNTLELLDPENINRLCSSLITYSINEKLYHQRWYDEVLAAILNSISILVRRNYLLAEKLLDRFDQMKVSDGYACEKMHAQLYRAFITYIKTKDNRRIYEIINACKALNLKELEDGFITGFKQIKQIYG
>CP019581.1|AZK91231.1|955816_955945_-|hypothetical-protein
MSDIYDAYVDPNYYTLNSPDHNVLRRVVVQKGNVASRYIYAE
>CP019581.1|AZK91230.1|954976_955729_-|hypothetical-protein
MDGQNGATAGGHTQTWEYANRTNEWFVGTKPKNKWTTQIARVHISSSTSRYTSNTQLPRLSYLNRAGSQQGINYAGADLKRVEAAVSPDYQYFMIATIDRYNTGYFSIYYLDDINTALDNAGVNDVNIQTLTSVKAFIIPSFVDNIGSIQGYDIDNGANYIYVSSQHSPGYEDISRKIVKIPWGSQNPSEWDFVRLDSNSTINSFSGNYQTEFESVQVIDNNNVWLTVAYHDMDTSTNLTVMNRIYKISW
>CP019581.1|AZK91229.1|953543_954602_-|S-layer-protein-precursor
MISLAAAALLAVAPVVSPAVVHAADTTSTTTTLNSNAENPVITYNGKKYDSNQDITAAIANSSFSRVPLKGSSTFIQDVKNAFSATESSTDNSKVNIVVYTGDLYTNIAGKYPVRVLATNKAGKSTALTFQVIVGNQGANATYAVAKPQVRGNVTLYTIRDGKVIHNSYGSYVLDGGTTVATFGTVEINGISYTRLNGPDSDLFIETKSVDGTYPESATNEDGQAKTVTKTLMHTAIAYNSDGHSTGKKYYAYRQLTLSAVKKNIKGSMYYNVQGTGDYIKVGNIDGTKRTLTRNAYIYATSKRRADRTLLRKGYTITTYGGSYKFKNGKRYYRIEGATSTNKRYVKVVNFK
>CP019581.1|AZK91228.1|952019_953204_-|Putative-transposase-DNA-binding-domain-protein
MLKGIKLRLYPNRTQQNQLEQMFGNDRFVWNQMLAMMNERYQNNKDLPFLGKFKLNYLLKPLKKEYPFLKNSDSSSLQVVNEFLTQSWKNFFQDKTGQIGKPRFHSRKYLKKSYTGKSIIKTAGKRYLKIPKLGYIKTSKIGVLQDVKIKRYTVVLEPTGKYYLSLQVEISEPEKYSLTGKQVGIDVGVADLAILSNGLKYPSFDSSYFEKKAKVWQRKCARRRHLAKLLVLQDRNKKVLCPRSLESFTNWQKAQKSIARYQAKIANQRRDYLHKLTTYLVKQYDVIAIEDLKTKNLQKNHHLAKSIANASWRMFRQMLEYKCEWYGKKLIAVDPKNTSRICSKCGYNSGAKPLEIREWTCSKCQTKHDRDINAAVNILHKATPTGQGLAMVTS
>CP019581.1|AZK91227.1|951149_951965_-|putative-oxidoreductase
MFPETRHFSAGVVHQINDLAQTQQVVEDGLEVGYRLVDTAQVYGNEQAVGDAIRHSNIPREDIFVTSKIWVDDYGYDATLKAFDETMKKLQLDYLDLYLIHKPYNDYYGTWRAMERLYKEGRIRAIGVSSFWNERLADLITFNDVKPAVNQIETNVWNQEWKSQKYMEKEGVQPEAWAPFAEGADHIFTNPVLEEIAEKHHKTTAQVMLRWFLQRNYVVIPKSVHKERLAQNFDIFDFELDKTDMEKIKTLDQGRSILEDEMDPEIAESFR
>CP019581.1|AZK91237.1|962554_963055_-|putative-acetyltransferase
MIIKPLISEDEAKETSRLFQKCWQNTYKDILPDVFLDNIPENAWVKRLNESGRHNLIFIDDDNKIRAAVSYGRPRDTRMLGCGELMALYVEPDFQGFNIGKTLLNAAENELKKMGYGKIYLWCIDGDENARQFFEHFGWVNNATEKFVEIAGKEYKYLLYQKNLHD
>CP019581.1|AZK91238.1|964054_964216_-|hypothetical-protein
MQKHIKVIIMTVVILALMVGGQVAPLAVADQLNLSKNAAIITMTITCRKLRTL
>CP019581.1|AZK91239.1|964396_964825_-|hypothetical-protein
MINNWVSSSKELQLLVDDYLLTVNYRSVIENDLVNYTQGIESYFRNERLTLRDKINKFIEELPESYRELLSEHVGNTDDWIGKLVSTRVFLTHGDRENMVVSNPYKLVQMTKIFDFMVRIFILQKLGITIDKPKILNKDQNV
>CP019581.1|AZK91240.1|965039_965237_+|Cold-shock-protein-2
MQGTVKWFNADKGFGFITGSDGKDAFVHFSSIKTDGFKSLEEGQKVSYDVEQGDRGPQATNVVPQ
>CP019581.1|AZK91241.1|965725_966034_-|hypothetical-protein
MKNKISDKNMFQNFEVKAYWFLNDNQNSGSYGFLKYNAGQDSVFEISPAFCDKTEQFNSPSPYDICGISEYGEIIRGIGYRVGSSFNHPGLSIEKIQFFDLK
>CP019581.1|AZK91242.1|966434_967787_-|23S-rRNA-(uracil-C(5))-methyltransferase-RlmCD
MEKNQIIDLEITDLSYEAMGVAHYNGMTVFVTNALPGEVVSAKILKVKKNFAFAKIEKIKKESPDRVKVKLNHGVQSGLASLAHIKYDKQLDFKRNQVVNLLKKAHLENIEVGETLASPEEVGYRNKAQVPVREVNGQLEIGFFRRHSHDLMPLTHFFTTDPEIDRVLVAVRDILRKYKVPAYDEINNKGEVRYLEVRRSKSTGEMMVILVCLHKDFMQLPNVAAEVSQIPGVSGLILNHNPKKTNVILGPKDYLVFGNDQITDQIGDLKFRISPQSFFQINSLQTPRLYNLAIKQADLKPDDVVIDAYSGIGTIGLSVAKHVKAVRGIEVVRDAIKDAKDNAKLNDITNAKYYLGKAEEIMPRWAKSGLKTDVVFVDPPRKGLTPEFINAAVKTGPKKIVYISCNPATLVRDLQLFQEKSYEFNRIDPVDMFPQTPHVESVTVLERTEK
>CP019581.1|AZK91243.1|968149_969526_+|Na(+)/H(+)-antiporter-NhaC
MKKEKVSFTESIIILIALLAILGISVIKFGLSPEVPVLFTVLLLTFWARFRGFTWKDVQDGIKEGIGVAIIPIFIFILIGALIGLWIKAGIIPSIMVLGFHLISGSFFVPSVFIVCAIVGVAIGSGFTTISTVGIALFGIGASMNANPALVAGAIISGAVFGDKMSPLSDSTNLSSAVTESELFDHIKNMMWSTIPSFVVSLILFWILGNSGHMDPTKIERTSHVLQINFSISWWAVVPIVLMLLCAWRKVPAIPTLFVNIAATVIMIFVQNPHESVQSLNNLIMNGFVAKTSDASVNALLTRGGISSMMATVALIISTLSLGGMLMKFNVVQSAMEPLVKHLRKPGRLITVTILSGICINLFVGEQYLSVILPGRAFKPAFDKIKLSPLALSRVLEDGGSVINYLIPWGVAGSFAAATLGVPVLQFLPFAFFSLLSPVFSIISGFTGIGLKWAKDKK
>CP019581.1|AZK91244.1|969562_969877_-|hypothetical-protein
MRGERSSRPEQVEKQALTLSFTKNAWDKYRQLTGSQKTFIDSELDDLKFNQNRQKSKQVNAELDQALVFEKNDAEIVITDIGYEPYRESQEHKKAQIRMEDMNN
>CP019581.1|AZK91245.1|970084_970789_+|Inner-membrane-protein-YbhL
MDNFSNPGHREVHDVSEVNGFLSKMYGYMGLSVLVSALAAFLTMTVFRSAVMQMPPAMMWIILFVPIGLSLGINFKATRNPVAGFVMLMILAVIYGFEFALLAGFYTQAQIGTAFVSSAAVFGAMAVFGTFTKKNLNNMGSYLSAALIGLLVAMVVNIFLRNSVASFVFSIIGVVIFTGLTAYDAQKMKAIYNNYGSQVSTNGLAVLGALQLYLDFVNIFLFLLQIFGMGGDRD
>CP019581.1|AZK91246.1|970833_971526_-|hypothetical-protein
MFKLHKVFDSRHYRRLSSVQKEELKEARDKVHQAQQKEPERLREHLETFNDAVIAIIITIIVLQIQPAFKASQYLEFLGNIVTFIIAFFIIADFWYELHLAFSYFIFKPDKITAICDFCLLATLSLLPVMTKWIMMHDSAFAVTNFGIVYFIAQILKVFVQYFGAKPLMRSSQVMNIMMVKTSVHRIILVFLLTIFLILLSLVVPKVAMVLYILIPFISFFKPNNSRGFR

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: CP019581_2

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

CP019581_2

1304353-1304505

TypeV

Consensus_repeat	Method
TTTGAACAAAACACATCATATACCATATTAGTTCGAATATCAAACTATT	CRISPRCasFinder

1 spacers

The CRISPR arrays of CP019581_2

>merge|CP019581|2|1304353-1304505|CRISPRCasFinder
TTTGAACAAAACACATCATATACCATATTAGTTCGAATATCAAACTATTCTGGTTAACGGCATTGTATACGGGTTGCGAGGACCCGTAAAGATTTTTTTAAATATTTGAACAAAACACATCATATACCATATTAGTTTGAATATCAAACTATT

>CP019581|2|1|1304353-1304505|CRISPRCasFinder
TTTGAACAAAACACATCATATACCATATTAGTTCGAATATCAAACTATT	CTGGTTAACGGCATTGTATACGGGTTGCGAGGACCCGTAAAGATTTTTTTAAATA
TTTGAACAAAACACATCATATACCATATTAGTTTGAATATCAAACTATT

Protein	Signature genes	Signature genes Name	Protein_function
CP019581.1\|AZK91583.1\|1301092_1302010_-\|Malonyl-CoA-acyl-carrier-protein-transacylase	unknown	unknown	gnl\|CDD\|223408
CP019581.1\|AZK91582.1\|1300361_1301093_-\|3-oxoacyl-[acyl-carrier-protein]-reductase-FabG	unknown	unknown	gnl\|CDD\|235500
CP019581.1\|AZK91593.1\|1309716_1311984_+\|UvrABC-system-protein-A	unknown	unknown	gnl\|CDD\|223256
CP019581.1\|AZK91596.1\|1313684_1314578_+\|Type-I-restriction-modification-DNA-specificity-domain-protein	unknown	unknown	gnl\|CDD\|341194
CP019581.1\|AZK91578.1\|1296822_1298202_-\|Biotin-carboxylase	unknown	unknown	gnl\|CDD\|236307
CP019581.1\|AZK91589.1\|1305021_1305771_-\|Pyrimidine-nucleoside-phosphorylase	unknown	unknown	gnl\|CDD\|274244
CP019581.1\|AZK91580.1\|1298636_1299107_-\|Biotin-carboxyl-carrier-protein-of-acetyl-CoA-carboxylase	unknown	unknown	gnl\|CDD\|235777
CP019581.1\|AZK91595.1\|1312941_1313475_-\|Transposase	unknown	unknown	gnl\|CDD\|379233
CP019581.1\|AZK91594.1\|1312084_1312663_-\|Integrase-core-domain-protein	unknown	unknown	gnl\|CDD\|222853
CP019581.1\|AZK91581.1\|1299110_1300340_-\|3-oxoacyl-[acyl-carrier-protein]-synthase-2	unknown	unknown	gnl\|CDD\|274452
CP019581.1\|AZK91586.1\|1303300_1303768_-\|DNA-binding-transcriptional-repressor-MarR	unknown	unknown	gnl\|CDD\|197670
CP019581.1\|AZK91590.1\|1305947_1307135_+\|Putative-niacin/nicotinamide-transporter-NaiP	unknown	unknown	gnl\|CDD\|340923
CP019581.1\|AZK91585.1\|1302320_1303304_-\|3-oxoacyl-[acyl-carrier-protein]-synthase-3	unknown	unknown	gnl\|CDD\|236475
CP019581.1\|AZK91584.1\|1302019_1302262_-\|Acyl-carrier-protein	unknown	unknown	gnl\|CDD\|179197
CP019581.1\|AZK91597.1\|1314574_1314733_+\|hypothetical-protein	unknown	unknown	unknown
CP019581.1\|AZK91588.1\|1304728_1304914_-\|Pyrimidine-nucleoside-phosphorylase	unknown	unknown	gnl\|CDD\|180387
CP019581.1\|AZK91587.1\|1303797_1304244_-\|3-hydroxyacyl-[acyl-carrier-protein]-dehydratase-FabZ	unknown	unknown	gnl\|CDD\|234568
CP019581.1\|AZK91579.1\|1298215_1298632_-\|3-hydroxyacyl-[acyl-carrier-protein]-dehydratase-FabZ	unknown	unknown	gnl\|CDD\|238615
CP019581.1\|AZK91592.1\|1308274_1309513_-\|Transposase	unknown	unknown	gnl\|CDD\|376574
CP019581.1\|AZK91591.1\|1307131_1307971_+\|putative-nicotinate-nucleotide-pyrophosphorylase-[carboxylating]	unknown	unknown	gnl\|CDD\|181221

Protein	Function_ID	Function_description	E-value
CP019581.1\|AZK91583.1\|1301092_1302010_-\|Malonyl-CoA-acyl-carrier-protein-transacylase	gnl\|CDD\|223408	COG0331, FabD, (acyl-carrier-protein) S-malonyltransferase [Lipid metabolism].	4.10709e-79
CP019581.1\|AZK91582.1\|1300361_1301093_-\|3-oxoacyl-[acyl-carrier-protein]-reductase-FabG	gnl\|CDD\|235500	PRK05557, fabG, 3-ketoacyl-(acyl-carrier-protein) reductase; Validated.	1.49589e-102
CP019581.1\|AZK91593.1\|1309716_1311984_+\|UvrABC-system-protein-A	gnl\|CDD\|223256	COG0178, UvrA, Excinuclease ATPase subunit [DNA replication, recombination, and repair].	0
CP019581.1\|AZK91596.1\|1313684_1314578_+\|Type-I-restriction-modification-DNA-specificity-domain-protein	gnl\|CDD\|341194	cd17513, RMtype1_S_AveSPN6ORF1907P_TRD2-CR2_like, Type I restriction-modification system specificity (S) subunit Target Recognition Domain-ConseRved domain (TRD-CR), similar to Archaeoglobus veneficus SNP6 S subunit (S.AveSPN6ORF1907P) TRD2-CR2 and Bacillus subtilis JRS2 S subunit (S.BsuJRS7ORF3308P) TRD1-CR1. The recognition sequences of Archaeoglobus veneficus SNP6 S subunit (S.AveSPN6ORF1907P) and Bacillus subtilis JRS2 S subunit (S.BsuJRS7ORF3308P) are undetermined. The restriction-modification (RM) system S subunit consists of two variable target recognition domains (TRD1 and 2) and two conserved regions (CR1 and CR2) which separate the TRDs. The TRDs each bind to different specific sequences in the DNA. RM systems protect a bacterial cell against invasion of foreign DNA by endonucleolytic cleavage of DNA that lacks a site specific modification. The host genome is protected from cleavage by methylation of specific nucleotides in the target sites. In type I systems, both restriction and modification activities are present in one heteromeric enzyme complex composed of one DNA specificity (S) subunit (this family), two modification (M) subunits and two restriction (R) subunits. This model contains both TRD1-CR1 and TRD2-CR2. It may also include TRD-CR-like sequence-recognition domains of various type II restriction enzymes and methyltransferases and type I DNA methyltransferases.	2.47955e-79
CP019581.1\|AZK91578.1\|1296822_1298202_-\|Biotin-carboxylase	gnl\|CDD\|236307	PRK08591, PRK08591, acetyl-CoA carboxylase biotin carboxylase subunit; Validated.	0
CP019581.1\|AZK91589.1\|1305021_1305771_-\|Pyrimidine-nucleoside-phosphorylase	gnl\|CDD\|274244	TIGR02644, Thymidine_phosphorylase, pyrimidine-nucleoside phosphorylase. In general, members of this protein family are designated pyrimidine-nucleoside phosphorylase, enzyme family EC 2.4.2.2, as in Bacillus subtilis, and more narrowly as the enzyme family EC 2.4.2.4, thymidine phosphorylase (alternate name: pyrimidine phosphorylase), as in Escherichia coli. The set of proteins encompassed by this model is designated subfamily rather than equivalog for this reason; the protein name from this model should be used when TIGR02643 does not score above trusted cutoff. [Purines, pyrimidines, nucleosides, and nucleotides, Other].	4.52763e-126
CP019581.1\|AZK91580.1\|1298636_1299107_-\|Biotin-carboxyl-carrier-protein-of-acetyl-CoA-carboxylase	gnl\|CDD\|235777	PRK06302, PRK06302, acetyl-CoA carboxylase biotin carboxyl carrier protein.	1.93289e-43
CP019581.1\|AZK91595.1\|1312941_1313475_-\|Transposase	gnl\|CDD\|379233	pfam13518, HTH_28, Helix-turn-helix domain. This helix-turn-helix domain is often found in transposases and is likely to be DNA-binding.	6.84311e-07
CP019581.1\|AZK91594.1\|1312084_1312663_-\|Integrase-core-domain-protein	gnl\|CDD\|222853	PHA02517, PHA02517, putative transposase OrfB; Reviewed.	8.24049e-11
CP019581.1\|AZK91581.1\|1299110_1300340_-\|3-oxoacyl-[acyl-carrier-protein]-synthase-2	gnl\|CDD\|274452	TIGR03150, fabF, beta-ketoacyl-acyl-carrier-protein synthase II. 3-oxoacyl-[acyl-carrier-protein] synthase 2 (KAS-II, FabF) is involved in the condensation step of fatty acid biosynthesis in which the malonyl donor group is decarboxylated and the resulting carbanion used to attack and extend the acyl group attached to the acyl carrier protein. Most genomes encoding fatty acid biosynthesis contain a number of condensing enzymes, often of all three types: 1, 2 and 3. Synthase 2 is mechanistically related to synthase 1 (KAS-I, FabB) containing a number of absolutely conserved catalytic residues in common. This model is based primarily on genes which are found in apparent operons with other essential genes of fatty acid biosynthesis (GenProp0681). The large gap between the trusted cutoff and the noise cutoff contains many genes which are not found adjacent to genes of the fatty acid pathway in genomes that often also contain a better hit to this model. These genes may be involved in other processes such as polyketide biosyntheses. Some genomes contain more than one above-trusted hit to this model which may result from recent paralogous expansions. Second hits to this model which are not next to other fatty acid biosynthesis genes may be involved in other processes. FabB sequences should fall well below the noise cutoff of this model. [Fatty acid and phospholipid metabolism, Biosynthesis].	0
CP019581.1\|AZK91586.1\|1303300_1303768_-\|DNA-binding-transcriptional-repressor-MarR	gnl\|CDD\|197670	smart00347, HTH_MARR, helix_turn_helix multiple antibiotic resistance protein.	4.05206e-16
CP019581.1\|AZK91590.1\|1305947_1307135_+\|Putative-niacin/nicotinamide-transporter-NaiP	gnl\|CDD\|340923	cd17365, MFS_PcaK_like, 4-hydroxybenzoate transporter PcaK and similar transporters of the Major Facilitator Superfamily. This aromatic acid:H(+) symporter subfamily includes Acinetobacter sp. 4-hydroxybenzoate transporter PcaK, Pseudomonas putida gallate transporter (GalT), Corynebacterium glutamicum gentisate transporter (GenK), Nocardioides sp. 1-hydroxy-2-naphthoate transporter (PhdT), Escherichia coli 3-(3-hydroxy-phenyl)propionate (3HPP) transporter (MhpT), and similar proteins. These transporters are involved in the uptake across the cytoplasmic membrane of specific aromatic compounds such as 4-hydroxybenzoate, gallate, gentisate (2,5-dihydroxybenzoate), 1-hydroxy-2-naphthoate, and 3HPP, respectively. The PcaK-like aromatic acid:H(+) symporter subfamily belongs to the Metazoan Synaptic Vesicle Glycoprotein 2 (SV2) and related small molecule transporter family (SV2-like) of the Major Facilitator Superfamily (MFS) of membrane transport proteins. MFS proteins are thought to function through a single substrate binding site, alternating-access mechanism involving a rocker-switch type of movement.	2.74764e-60
CP019581.1\|AZK91585.1\|1302320_1303304_-\|3-oxoacyl-[acyl-carrier-protein]-synthase-3	gnl\|CDD\|236475	PRK09352, PRK09352, beta-ketoacyl-ACP synthase 3.	3.30903e-156
CP019581.1\|AZK91584.1\|1302019_1302262_-\|Acyl-carrier-protein	gnl\|CDD\|179197	PRK00982, acpP, acyl carrier protein; Provisional.	2.22825e-16
CP019581.1\|AZK91588.1\|1304728_1304914_-\|Pyrimidine-nucleoside-phosphorylase	gnl\|CDD\|180387	PRK06078, PRK06078, pyrimidine-nucleoside phosphorylase; Reviewed.	1.00103e-18
CP019581.1\|AZK91587.1\|1303797_1304244_-\|3-hydroxyacyl-[acyl-carrier-protein]-dehydratase-FabZ	gnl\|CDD\|234568	PRK00006, fabZ, 3-hydroxyacyl-ACP dehydratase FabZ.	1.23853e-76
CP019581.1\|AZK91579.1\|1298215_1298632_-\|3-hydroxyacyl-[acyl-carrier-protein]-dehydratase-FabZ	gnl\|CDD\|238615	cd01288, FabZ, FabZ is a 17kD beta-hydroxyacyl-acyl carrier protein (ACP) dehydratase that primarily catalyzes the dehydration of beta-hydroxyacyl-ACP to trans-2-acyl-ACP, the third step in the elongation phase of the bacterial/ plastid, type II, fatty-acid biosynthesis pathway.	1.46713e-44
CP019581.1\|AZK91592.1\|1308274_1309513_-\|Transposase	gnl\|CDD\|376574	pfam01610, DDE_Tnp_ISL3, Transposase. Transposase proteins are necessary for efficient DNA transposition. Contains transposases for IS204, IS1001, IS1096 and IS1165.	1.35568e-43
CP019581.1\|AZK91591.1\|1307131_1307971_+\|putative-nicotinate-nucleotide-pyrophosphorylase-[carboxylating]	gnl\|CDD\|181221	PRK08072, PRK08072, carboxylating nicotinate-nucleotide diphosphorylase.	3.86206e-124

>CP019581.1|AZK91587.1|1303797_1304244_-|3-hydroxyacyl-[acyl-carrier-protein]-dehydratase-FabZ
MSVLDAAEIMDLIPNRYPILFMDKVDELNPGESIICTKNVTINEEFFQGHFPGNPVMPGVLIIESLAQAASILILKTEKYQGKTAYLGAIDSAKFRKVVRPGDVLKLHVTMEKQRDNMGKVKCEAKVEDKVACSAELTFIVPDPKKKI
>CP019581.1|AZK91586.1|1303300_1303768_-|DNA-binding-transcriptional-repressor-MarR
MNAISDEIKEDYNFISDSLVDIYDQIMRIEESEIKKSRFKDITAKELHLVHTIGLHDHKTTSEVARILRLSKGTLTANLNNLERKGYIFRIRNQRDRRIINLVLTSKGRLLYRAHYAFHRKLVEQCLKGFDGSDIKKMKQALMNVEDFIGEVSGR
>CP019581.1|AZK91585.1|1302320_1303304_-|3-oxoacyl-[acyl-carrier-protein]-synthase-3
MKFEDFKIMATASSAPDHVVTNDELATMMDTSDEWITQRTGIKRRRIATEETTSSMCTDVATQLIAQSDLTAKDIDLIAVATMSPDYLTPSVSAMVQGNIGADHAIAFDIDAACSGFVYGLHLVKQMLIANQQKNAILIGGEILSKLLDWSDRSTAVLFGDGAGGVLIRNTAVDKGSFISEDLRTLGNLGQYLTAGQTGNPSPFATDQQPFSPFFKMNGRRVYSFAVKNVPESINDALKQANLTADEVDCFVLHQANQRIVERIADELAVSMAKFPINIDEYGNTAAASEPILLDQLVKQKIIKRGDVIALSGFGGGLTVGTMIMKY
>CP019581.1|AZK91584.1|1302019_1302262_-|Acyl-carrier-protein
MTKEEVFNKIKDIIVDQLDVDADKVKENTNFKNDLDLDSLDIFEVIDKIEDLYDIEIDTDEGMETVGELVDYVLKQKTDK
>CP019581.1|AZK91583.1|1301092_1302010_-|Malonyl-CoA-acyl-carrier-protein-transacylase
MKLGYLFSGQGKQFDEMGQDLYQQEPVYRQTIDQASEALNMDMSDATVFDNPVNTQVAIVAMSTGIERIINQDFGDPVGATGLSLGEYSAIVAAKGLDFSDALQLVRDRSHYMDQAGQDHPGKMAAVLKTTADMVDQAVKVGSKKGEIYAANYNTDSQIVIGGSIEGLQAATDYLHEHGVKRVVPLKMTVASHTPFMQEASDLLAKRIQDVSFNQLAFPVISNTTSQPFEVNTIKQTLIDQLINPTHFYNCIQQLTQLGVDTVVELGPGDTLMKFAKNVVANDHTFHIDSVKTLNDFRSKAKLVK
>CP019581.1|AZK91582.1|1300361_1301093_-|3-oxoacyl-[acyl-carrier-protein]-reductase-FabG
MSDTKQVALVTGAAKGIGLAIAKRLSSDGMTVVINSHHTLTDEEKQSFSDAGFSFDNLVGDVANEADAEKIVGEVVEKYGQIDVLVNNAGITKDKLLSRLKLADFKAVIDTNLVGAFNMTKFAMKFMQKSRSGAIVNLSSISGLHGNLGQANYSASKAGLVGLTKTAAREGALRNIRCNAVAPGMVATDMTGKMSERRQKEFTDQIPLKRFAEPDEIADAVAFLIHNQYITGQVVTVDGGLTI
>CP019581.1|AZK91581.1|1299110_1300340_-|3-oxoacyl-[acyl-carrier-protein]-synthase-2
MSRVVITGMGIVSPIGNDVESFLKNLFASKVGINPITKFDAEPTGITVAGEVKDFDPLKRVDKKFAKRNDLFCTYALYSAKEAMEMAGLTEDNIDPEDLGVIYGSGIGGLTTIQEQVIKMHDKSPKRVSPLFVPDSIINMAAGNISIAFNALNTSQGIVTACSSGTNAIGNAFEYIKQGKAKAIIAGGTEASVNEIGISGFAALTALSKETDPKKASIPFDKDRNGFVLGEGSGTVILEDYDHAKARHANILAEIVGYGTTSDAYHMTAPDPEGKGAIRAMQQAVDEAGIDETEVDYINAHGTSTHANDSAESKAIKQVFAKNDHVKVSSTKGMTGHALGAAGAIEAVATIGAIQHNQMPVNVGVVNQDEACDIELVNDDNKKAPVNYAISNSFGFGGHNAVIVFKGCD
>CP019581.1|AZK91580.1|1298636_1299107_-|Biotin-carboxyl-carrier-protein-of-acetyl-CoA-carboxylase
MNEKEIERLLEKFDQSSLKDFELTQDDFKLKLSKREQNDQVVVQQPTGSKTPVSEVPKSTSANSQPAGEPQQSVKDNVAEIKAPFVGVVYFAPSPDKPVYKKQGDHVEKGEVVCVIEAMKMINEVKSDVTGTISNILVEDGSMVEYDQPIFQVTKG
>CP019581.1|AZK91579.1|1298215_1298632_-|3-hydroxyacyl-[acyl-carrier-protein]-dehydratase-FabZ
MKTAVNDVIPQRYPFEMIDKFIDVQPGVSASAIKLISINEWFFANQTSSRLAVPRPIMIEAMAQTGVAAILSIPENKGKNVFFGGIKNATFQDDFRPGDKLEFEVVMKKLKRNIGLGHGTIHRDGQSICEADLIFAVE
>CP019581.1|AZK91578.1|1296822_1298202_-|Biotin-carboxylase
MFKKVLVANRGEIAVQIIRALHDMGITAVAVYSSADKDSLFVHLADEAICIGGPQPSESYLNMAQIISAANLTGCEAIHPGYGFLSENAEFAELCETCHIKFVGPSHELISLMGDKSNAREAMEKAGVPVIPGSQGVVKTVSQAETVAEKIGFPVLLKAAAGGGGKGIREVDRPEDLHSAFEQTQQEARVSFNNDDIYVEKLIRNAKHVEMQVIADEFNHVVYLPERDCSLQRNHQKVIEESPCVQISPTERKKLGEIVANATLKLGYTNTGTYEFLMTEDHHFYFMEMNTRLQVEHTITEEVTGIELVKAQLKVADGQELPFTQADVAVKGHALECRLNAEDPSHNFAPRPGRINHLFFPAGSLGVRIDSGVAQGSFISPFYDSMIAKVVVHLNDRNTVIAKMNRILEELKINGVVTNQTFLKYLINTAEFNSGQYSTNFIENQVLTNKEGFHVAESV
>CP019581.1|AZK91588.1|1304728_1304914_-|Pyrimidine-nucleoside-phosphorylase
MDYSVGIVLNKKIGDKVESGEPLLTIYSNREEVDDIKKLLYDNIEVADTAKVPELIYTTIE
>CP019581.1|AZK91589.1|1305021_1305771_-|Pyrimidine-nucleoside-phosphorylase
MGDKTSIPLAAVVAALGIPVPMISGRGLGHTGGTLDKLEAIPGYQVEISEQDFIKQVKKDHLAIIGATGNIAPADKKIYALRDVTDTVDSIPLIAGSIMSKKIASGTDALVIDVKTGAGAFMKTLEDSKALARALVDIGKGVGMQFMALITDMNQPLGNAIGNSLEIEESIDLLKGNGPADLEKLIVTIGGYMAVMGDKAKTTAEGQKMCEEVIHNGQALASFEAMVRDQGGDPNVVNDPNGVLPQAKY
>CP019581.1|AZK91590.1|1305947_1307135_+|Putative-niacin/nicotinamide-transporter-NaiP
MDNTQQRPTFIFLIIGTAWLFDAMDVGLLSFIMPIVHQQWALSNSQTGLISSVSTIGMVCGGFYFGHLADRIGRKNTLIATLLTFSIGNLILAISPGFYTFLGIRFFVGMGLGGELPVAATYIADIYRGTKRSQMLILADSFWALGWLVASFLSFLLTPVLGWRGILVVTAIAGVFAIVLRKHIHETAPKSTGTQHWLVSLKTTFKPWTLMLWLAWFMVMFSYYGMFMWLPSIMVDKGYGIVNSFGYTTIIVVAQLPGYLCASWLAKRIRVKYVFAIYMLGTAFGAIMFGQSASALLIVISGCVLSFFNLGAYGAIIALTPELYAHNIRGTMTGMAQGIGRIGAIFGPLLIGVLMDHQISISIIFVIFMVSLLIGSIAVLALPSADQQPNGEVNQ
>CP019581.1|AZK91591.1|1307131_1307971_+|putative-nicotinate-nucleotide-pyrophosphorylase-[carboxylating]
MNPIVLKEKISEFLKEDLGFGDLSVAFLPGGTPLSGSFIAKQSGIICGQEIPQATYDLLGHATYKPRIPDGAPVKAGDIIGTVSGTAQTLLSGERVTLNLIQRMSGIATQTTHFVKLLDDATIRITDTRKTAPGLRLFDKYAVSVGGGFNHRFDLTGGIMLKDNHIALAGGVTQALAAVKRHVGPLTPVEVEVETEEELRQAVAGGANVIMFDNQNPETIKQWRQLVPKTIKVEASGGITAESISTFKGCGADFISIGNLTNDVTPLDISFLVAGAVKS
>CP019581.1|AZK91592.1|1308274_1309513_-|Transposase
MSQLDNTLKLLGITDTNIQVFGTREEFHGRGSGRKKYLVIQAELTYTLRRCPSCGYNMLPPSGHKLTHVHIAGPMDRPVILELNKQRWRCSNCHSTCTATTPVVSTNHAIGHGLATHVLKLASKSLPAKTIASLTGISTNSVQRILTANIHPHASRRLPINLCFDEFRSTHGSMSFICIDADTHKSVKVLSDRLNRTIKQFFLSQYSTAERAAVQRVIMDMNASYQAFVHELFPNAELIIDRFHIIQLMGRTMDTIRTQCFKQLDKHSRKYKVLKSLWRLFHKANPDIQKSRYLFGLNEYSTEQNAIDIGTDTFPAFKTAYETYIDLHDALMGRHADELKNIITNYQPNGTPLDTAMHTLRKNLNGVINAAKSSYSNGPIEGINRMIRELKRACYGFSNQANMFTRVYQLIA
>CP019581.1|AZK91593.1|1309716_1311984_+|UvrABC-system-protein-A
MTDLFADGTISIHGAQENNLKDVSLDIPKHKTTVFAGLSGSGKSSLVFDTLAAVSRRELNETFPSFTQQYLPKYGQPEVNRIDNLPVAIVVEQKPIGRNSRSTLATYTGIYSVLRLMFSRIGQPWVGYSEWFSFNLPQGMCPKCQGLGFVDDIDERQLIDPNKSLNEGAMTFAGFQPGTWRWKEYGNSGLFDLDKKIKDYTDEEYDLFMHAPQQKLKNPPANWGRTALYEGLVPRMLRSVIHSASGRHHEAALSKIVTRKPCPVCHGTRLNKKALTGKIAGKNIAEVSDMDLVSVLKFLDNISDPKAKTMVRELRSKIQALVDIGLGYLSLGRGTDTLSGGEAQRIKIAKYLTSSLSDLVYVLDEPSVGLHPHDIKLITQSLKKLKEHGNTIILVDHNPAIISTADYVVEMGPQAGKNGGQVTSTGTYDELLRSDTITGKMLREKITFPKPREPQSWLNVNHVTSHNLKDVSTRIPQGVMTVISGPAGSGKSTLVQAFKQQVSDQDYIDLSQDSVGLNIRSTPATYLNILNPLRKLFSKANNGVSTQLFSYNGKGACPRCKGKGVMITEMAFMDPIVQECELCHGKRYSQEALQYTYHGKDISEVLNLSINDTLEFFKDVPDIYKKVSLLHQVGLGYLNLSQSMTTLSGGEVQRVKLAMELNHTGRIYFLDEPTTGLHLQDTQQLIDLFEGLVDKGNTLILIEHNLKLISRADWLVDMGPDAGKFGGQVCFEGHPKDSLNDKNSRTGAALAAIIS
>CP019581.1|AZK91594.1|1312084_1312663_-|Integrase-core-domain-protein
MDELNVQVSLYNRHRNGRYSSYKGTVGKVARNVLHQHFNETVPFKVLHTDVTQVRLADTKWAYVSAITDEASKEVLAFQVSNSPNSKLIMDTLDELTENIPEGIKPIIHSDQGWHYQLNYYTDKLSEKNLYKACLVRETVLIMRQLKASFIFLKQNVLMDFHSVKILENSRKSQRITSIGLTIDEYHRKQKA
>CP019581.1|AZK91595.1|1312941_1313475_-|Transposase
MVKYSSELKAEVVSEYLQGDISISLLSKKRNLPRIQVGRWIQNFRLSGADALKRRRVKRSFSVEFKVDVINYYQTHDETLAEVSAKFDVNSCQISLWRTAFNEYGIEALKPHPKGRKTKVKHNKKKLRKLVNKNEIDQLREELTKKNQELYDAKLENEILKKSMTLFGTSKDERKHK
>CP019581.1|AZK91596.1|1313684_1314578_+|Type-I-restriction-modification-DNA-specificity-domain-protein
MLELAFEKEVVKTLTTGSNQWVERKDLYGATPDQLWANFRDKLNNNNYAKLQGHPLTDTEFNQVKRAIEFPTPYEAAKLLAAENGSKFPQLRFAGFADAWEQRKLSDFSKTTYGGGTPKTAVTEYWDGNIPWIQSSNLTVDDVQEVNLDKFITDNAIKNSAAKLIPANSIAIVTRVGVGKLTLMKQEFATSQDFLSLSELHVDEQFGLYSIYKLLQKELNNIQGTSIKGMTKADLLTKDIMIPVEKDEQIKIGSFFKQLDHLITLHQRKLEKLQELKKRVSTKDVLLILNLIKFRIL
>CP019581.1|AZK91597.1|1314574_1314733_+|hypothetical-protein
MKPHDLIFIVLGQHLIHLYNGLSREIKNQPRAIKPLLTAKESYNTSKVSKQG

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: CP019581_3

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

CP019581_3

2064058-2066355

TypeI

I-C

Consensus_repeat	Method
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	PILER-CR
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	CRISPRCasFinder
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	CRT

34 spacers

cas2,cas1,cas4,cas7,cas8c,cas5,cas3

The CRISPR arrays of CP019581_3

>merge|CP019581|3|2064058-2066355|PILER-CR,CRISPRCasFinder,CRT
GTCGCACTCCTTGTGAGTGCGTGGATTGAAATAATGACTGATGAACAAAAGACAGCATTGAAGAATGTCGCACTCCTTGTGAGTGCGTGGATTGAAATTGTTCAGCTCTATCTTGATGTCAAAGATCCTAACGGGTCGCACTCCTTGTGAGTGCGTGGATTGAAATATTCTGTAAGGACTGAAACACAAACTCTAAAATATAGTCGCACTCCTTGTGAGTGCGTGGATTGAAATATCGTTATGCAGGTATTACTACTGCTACTAATACGTCGCACTCCTTGTGAGTGCGTGGATTGAAATTCAGGAGATACTGCCGTTGGCTTTGAAGATAAATAGTCGCACTCCTTGTGAGTGCGTGGATTGAAATAATTCATTACTGGCATTACTCCAGTCACTGCGCCAGTCGCACTCCTTGTGAGTGCGTGGATTGAAATGAAAGGAAATATATATGTCAGTCAAAGTTAATGGTGTCGCACTCCTTGTGAGTGCGTGGATTGAAATGATTTTGTTAGAAAATTAACCGATGATTTTTTACAGTCGCACTCCTTGTGAGTGCGTGGATTGAAATTACCCACCTAGCTTAGCACCTACATGGAATGACAGTCGCACTCCTTGTGAGTGCGTGGATTGAAATCATTGTAGTAAAAGTTGCAGGGTCTTGAGTAAGAACGTCGCACTCCTTGTGAGTGCGTGGATTGAAATAATTAAGTCTAATCATAGGGGCAATAATTGCTTAGTCGCACTCCTTGTGAGTGCGTGGATTGAAATTTTTTCGTCTTCTGCTCCTAGTGACTTAGTGAGCCGTCGCACTCCTTGTGAGTGCGTGGATTGAAATAAGTGAATCGACAGGTATTGCAGATGATGATTTAGTCGCACTCCTTGTGAGTGCGTGGATTGAAATAAGATGTGGAAGAGTGCAAGCACACACAGTCCCAAGTCGCACTCCTTGTGAGTGCGTGGATTGAAATTTAGAATACTTATGATCCTTAGATAGATGAACCGGTCGCACTCCTTGTGAGTGCGTGGATTGAAATCTCTGATCTGCTCAGCACGTTGCTCTTGCTTTGAAGTCGCACTCCTTGTGAGTGCGTGGATTGAAATGATTATTCGGAACAACAGATGATCCTAAATGCTCAGTCGCACTCCTTGTGAGTGCGTGGATTGAAATCTAAAGCATACTTAGTAGCATATGAACTGGCTGACGTCGCACTCCTTGTGAGTGCGTGGATTGAAATTACAAACACTTGCCAACTTATAATCCACAAATGCGTCGCACTCCTTGTGAGTGCGTGGATTGAAATAAAGGTGTGTGGATACCTGCTGAATATTGGTTAGGTCGCACTCCTTGTGAGTGCGTGGATTGAAATAGCATCAACGGCTCTAATTATGTCATTGCCGGTTTGTCGCACTCCTTGTGAGTGCGTGGATTGAAATACCTGATCAAACGTTAGGCAATAGATTAACCGAAGTCGCACTCCTTGTGAGTGCGTGGATTGAAATTTTACGAATGTCTTGCCAATTAGTATATTTACTTGTCGCACTCCTTGTGAGTGCGTGGATTGAAATAGAATCAAGACCACCTGTTAGCGTTTTACCACCGGTCGCACTCCTTGTGAGTGCGTGGATTGAAATAAAGAACATAGTTTGCAGAACTGTTTCCAAGTAAAGTCGCACTCCTTGTGAGTGCGTGGATTGAAATGGCTTTAGATGCGTCAAATGCCGCCTGTGGGCTATCGTCGCACTCCTTGTGAGTGCGTGGATTGAAATAGAAGATGGATACAATTTTTAGAAATTCCAGTCTGTCGCACTCCTTGTGAGTGCGTGGATTGAAATACACCATATGTGGTCAACGCTTTAATTGGATTACGGTCGCACTCCTTGTGAGTGCGTGGATTGAAATACTAACTGGAACATCCAAGTACTGTGCGGAAACCGTCGCACTCCTTGTGAGTGCGTGGATTGAAATATCGGCTAATTGCTTTTCAAGTGAATCAGCCTTTGGTCGCACTCCTTGTGAGTGCGTGGATTGAAATACTGAGACGCTAGACGCTATTAGATCACAGTCACGTCGCACTCCTTGTGAGTGCGTGGATTGAAATATCAAGCTTGCCAACGGGTCGATTTTATTCTGTGAGTCGCACTCCTTGTGAGTGCGTGGATTGAAATTTTTGAATAGATGGCATGTAAGTCTGATATAGTTGTCGCACTCCTCGTGAGTGCGTGGATTGAAATTTTAGGTCCATTGCACTCTTGCCAGTGAAGTCGTGTCGCACTCCTTGTGATGCACTTGTGGGTGTA

>CP019581|3|2|2064058-2066289|PILER-CR
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	AATGACTGATGAACAAAAGACAGCATTGAAGAAT
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	TGTTCAGCTCTATCTTGATGTCAAAGATCCTAACGG
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	ATTCTGTAAGGACTGAAACACAAACTCTAAAATATA
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	ATCGTTATGCAGGTATTACTACTGCTACTAATAC
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	TCAGGAGATACTGCCGTTGGCTTTGAAGATAAATA
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	AATTCATTACTGGCATTACTCCAGTCACTGCGCCA
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	GAAAGGAAATATATATGTCAGTCAAAGTTAATGGT
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	GATTTTGTTAGAAAATTAACCGATGATTTTTTACA
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	TACCCACCTAGCTTAGCACCTACATGGAATGACA
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	CATTGTAGTAAAAGTTGCAGGGTCTTGAGTAAGAAC
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	AATTAAGTCTAATCATAGGGGCAATAATTGCTTA
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	TTTTTCGTCTTCTGCTCCTAGTGACTTAGTGAGCC
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	AAGTGAATCGACAGGTATTGCAGATGATGATTTA
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	AAGATGTGGAAGAGTGCAAGCACACACAGTCCCAA
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	TTAGAATACTTATGATCCTTAGATAGATGAACCG
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	CTCTGATCTGCTCAGCACGTTGCTCTTGCTTTGAA
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	GATTATTCGGAACAACAGATGATCCTAAATGCTCA
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	CTAAAGCATACTTAGTAGCATATGAACTGGCTGAC
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	TACAAACACTTGCCAACTTATAATCCACAAATGC
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	AAAGGTGTGTGGATACCTGCTGAATATTGGTTAG
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	AGCATCAACGGCTCTAATTATGTCATTGCCGGTTT
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	ACCTGATCAAACGTTAGGCAATAGATTAACCGAA
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	TTTACGAATGTCTTGCCAATTAGTATATTTACTT
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	AGAATCAAGACCACCTGTTAGCGTTTTACCACCG
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	AAAGAACATAGTTTGCAGAACTGTTTCCAAGTAAA
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	GGCTTTAGATGCGTCAAATGCCGCCTGTGGGCTATC
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	AGAAGATGGATACAATTTTTAGAAATTCCAGTCT
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	ACACCATATGTGGTCAACGCTTTAATTGGATTACG
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	ACTAACTGGAACATCCAAGTACTGTGCGGAAACC
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	ATCGGCTAATTGCTTTTCAAGTGAATCAGCCTTTG
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	ACTGAGACGCTAGACGCTATTAGATCACAGTCAC
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	ATCAAGCTTGCCAACGGGTCGATTTTATTCTGTGA
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	TTTTGAATAGATGGCATGTAAGTCTGATATAGTT
GTCGCACTCCTCGTGAGTGCGTGGATTGAAAT

>CP019581|3|2|2064058-2066289|CRISPRCasFinder
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	AATGACTGATGAACAAAAGACAGCATTGAAGAAT
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	TGTTCAGCTCTATCTTGATGTCAAAGATCCTAACGG
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	ATTCTGTAAGGACTGAAACACAAACTCTAAAATATA
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	ATCGTTATGCAGGTATTACTACTGCTACTAATAC
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	TCAGGAGATACTGCCGTTGGCTTTGAAGATAAATA
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	AATTCATTACTGGCATTACTCCAGTCACTGCGCCA
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	GAAAGGAAATATATATGTCAGTCAAAGTTAATGGT
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	GATTTTGTTAGAAAATTAACCGATGATTTTTTACA
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	TACCCACCTAGCTTAGCACCTACATGGAATGACA
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	CATTGTAGTAAAAGTTGCAGGGTCTTGAGTAAGAAC
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	AATTAAGTCTAATCATAGGGGCAATAATTGCTTA
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	TTTTTCGTCTTCTGCTCCTAGTGACTTAGTGAGCC
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	AAGTGAATCGACAGGTATTGCAGATGATGATTTA
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	AAGATGTGGAAGAGTGCAAGCACACACAGTCCCAA
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	TTAGAATACTTATGATCCTTAGATAGATGAACCG
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	CTCTGATCTGCTCAGCACGTTGCTCTTGCTTTGAA
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	GATTATTCGGAACAACAGATGATCCTAAATGCTCA
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	CTAAAGCATACTTAGTAGCATATGAACTGGCTGAC
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	TACAAACACTTGCCAACTTATAATCCACAAATGC
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	AAAGGTGTGTGGATACCTGCTGAATATTGGTTAG
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	AGCATCAACGGCTCTAATTATGTCATTGCCGGTTT
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	ACCTGATCAAACGTTAGGCAATAGATTAACCGAA
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	TTTACGAATGTCTTGCCAATTAGTATATTTACTT
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	AGAATCAAGACCACCTGTTAGCGTTTTACCACCG
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	AAAGAACATAGTTTGCAGAACTGTTTCCAAGTAAA
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	GGCTTTAGATGCGTCAAATGCCGCCTGTGGGCTATC
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	AGAAGATGGATACAATTTTTAGAAATTCCAGTCT
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	ACACCATATGTGGTCAACGCTTTAATTGGATTACG
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	ACTAACTGGAACATCCAAGTACTGTGCGGAAACC
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	ATCGGCTAATTGCTTTTCAAGTGAATCAGCCTTTG
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	ACTGAGACGCTAGACGCTATTAGATCACAGTCAC
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	ATCAAGCTTGCCAACGGGTCGATTTTATTCTGTGA
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	TTTTGAATAGATGGCATGTAAGTCTGATATAGTT
GTCGCACTCCTCGTGAGTGCGTGGATTGAAAT

>CP019581|3|1|2064058-2066355|CRT
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	AATGACTGATGAACAAAAGACAGCATTGAAGAAT
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	TGTTCAGCTCTATCTTGATGTCAAAGATCCTAACGG
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	ATTCTGTAAGGACTGAAACACAAACTCTAAAATATA
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	ATCGTTATGCAGGTATTACTACTGCTACTAATAC
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	TCAGGAGATACTGCCGTTGGCTTTGAAGATAAATA
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	AATTCATTACTGGCATTACTCCAGTCACTGCGCCA
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	GAAAGGAAATATATATGTCAGTCAAAGTTAATGGT
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	GATTTTGTTAGAAAATTAACCGATGATTTTTTACA
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	TACCCACCTAGCTTAGCACCTACATGGAATGACA
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	CATTGTAGTAAAAGTTGCAGGGTCTTGAGTAAGAAC
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	AATTAAGTCTAATCATAGGGGCAATAATTGCTTA
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	TTTTTCGTCTTCTGCTCCTAGTGACTTAGTGAGCC
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	AAGTGAATCGACAGGTATTGCAGATGATGATTTA
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	AAGATGTGGAAGAGTGCAAGCACACACAGTCCCAA
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	TTAGAATACTTATGATCCTTAGATAGATGAACCG
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	CTCTGATCTGCTCAGCACGTTGCTCTTGCTTTGAA
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	GATTATTCGGAACAACAGATGATCCTAAATGCTCA
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	CTAAAGCATACTTAGTAGCATATGAACTGGCTGAC
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	TACAAACACTTGCCAACTTATAATCCACAAATGC
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	AAAGGTGTGTGGATACCTGCTGAATATTGGTTAG
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	AGCATCAACGGCTCTAATTATGTCATTGCCGGTTT
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	ACCTGATCAAACGTTAGGCAATAGATTAACCGAA
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	TTTACGAATGTCTTGCCAATTAGTATATTTACTT
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	AGAATCAAGACCACCTGTTAGCGTTTTACCACCG
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	AAAGAACATAGTTTGCAGAACTGTTTCCAAGTAAA
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	GGCTTTAGATGCGTCAAATGCCGCCTGTGGGCTATC
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	AGAAGATGGATACAATTTTTAGAAATTCCAGTCT
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	ACACCATATGTGGTCAACGCTTTAATTGGATTACG
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	ACTAACTGGAACATCCAAGTACTGTGCGGAAACC
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	ATCGGCTAATTGCTTTTCAAGTGAATCAGCCTTTG
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	ACTGAGACGCTAGACGCTATTAGATCACAGTCAC
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	ATCAAGCTTGCCAACGGGTCGATTTTATTCTGTGA
GTCGCACTCCTTGTGAGTGCGTGGATTGAAAT	TTTTGAATAGATGGCATGTAAGTCTGATATAGTT
GTCGCACTCCTCGTGAGTGCGTGGATTGAAAT	TTTAGGTCCATTGCACTCTTGCCAGTGAAGTCGT
GTCGCACTCCTTGTGATGCACTTGTGGGTGTA

Protein	Signature genes	Signature genes Name	Protein_function
CP019581.1\|AZK92347.1\|2070452_2071055_+\|Dephospho-CoA-kinase	unknown	unknown	gnl\|CDD\|234620
CP019581.1\|AZK92348.1\|2071057_2071525_+\|Transcriptional-repressor-NrdR	unknown	unknown	gnl\|CDD\|234774
CP019581.1\|AZK92342.1\|2062564_2063596_+\|CRISPR-associated-protein-Cas4/endonuclease-Cas1-fusion	cas1	cd09721_cas1_CAS-I-C	gnl\|CDD\|188360
CP019581.1\|AZK92350.1\|2072890_2073799_+\|Primosomal-protein-DnaI	unknown	unknown	gnl\|CDD\|236353
CP019581.1\|AZK92346.1\|2069625_2070456_+\|Formamidopyrimidine-DNA-glycosylase	unknown	unknown	gnl\|CDD\|234899
CP019581.1\|AZK92343.1\|2063605_2063896_+\|CRISPR-associated-endonuclease-Cas2	cas2	cd09725_cas2_CAS-I:CAS-II:CAS-III:CAS-V	gnl\|CDD\|187856
CP019581.1\|AZK92352.1\|2076115_2076487_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|226131
CP019581.1\|AZK92335.1\|2052474_2054016_+\|Bifunctional-purine-biosynthesis-protein-PurH	unknown	unknown	gnl\|CDD\|234854
CP019581.1\|AZK92334.1\|2051876_2052473_+\|Phosphoribosylglycinamide-formyltransferase	unknown	unknown	gnl\|CDD\|187714
CP019581.1\|AZK92344.1\|2066590_2066749_+\|hypothetical-protein	unknown	unknown	unknown
CP019581.1\|AZK92338.1\|2058338_2059082_+\|CRISPR-associated-protein-Cas5	cas5	cd09752_cas5_CAS-I-C	gnl\|CDD\|273847
CP019581.1\|AZK92353.1\|2076493_2077744_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|377221
CP019581.1\|AZK92341.1\|2061911_2062568_+\|PD-(D/E)XK-nuclease-superfamily-protein	cas4	pfam01930_cas4_CAS-I	gnl\|CDD\|273040
CP019581.1\|AZK92336.1\|2054028_2055288_+\|Phosphoribosylamine--glycine-ligase	unknown	unknown	gnl\|CDD\|234856
CP019581.1\|AZK92345.1\|2066953_2069617_+\|DNA-polymerase-I	unknown	unknown	gnl\|CDD\|235591
CP019581.1\|AZK92351.1\|2074089_2076024_+\|Threonine--tRNA-ligase	unknown	unknown	gnl\|CDD\|234752
CP019581.1\|AZK92337.1\|2055789_2058324_+\|helicase-Cas3	cas3	COG1203_cas3_CAS-I	gnl\|CDD\|224124
CP019581.1\|AZK92349.1\|2071527_2072859_+\|Replication-initiation-and-membrane-attachment-protein	unknown	unknown	gnl\|CDD\|226138
CP019581.1\|AZK92340.1\|2061057_2061909_+\|hypothetical-protein	cas7	COG3649_cas7_CAS-I-C	gnl\|CDD\|187820
CP019581.1\|AZK92339.1\|2059081_2061055_+\|CRISPR-associated-protein-(Cas_Csd1)	cas8c	pfam09709_cas8c_CAS-I-C	gnl\|CDD\|378245

Protein	Function_ID	Function_description	E-value
CP019581.1\|AZK92347.1\|2070452_2071055_+\|Dephospho-CoA-kinase	gnl\|CDD\|234620	PRK00081, coaE, dephospho-CoA kinase; Reviewed.	4.5835e-84
CP019581.1\|AZK92348.1\|2071057_2071525_+\|Transcriptional-repressor-NrdR	gnl\|CDD\|234774	PRK00464, nrdR, transcriptional repressor NrdR.	6.49925e-87
CP019581.1\|AZK92342.1\|2062564_2063596_+\|CRISPR-associated-protein-Cas4/endonuclease-Cas1-fusion	gnl\|CDD\|188360	TIGR03640, cas1_DVULG, CRISPR-associated endonuclease Cas1, subtype I-C/DVULG. The CRISPR-associated protein Cas1 is virtually universal to CRISPR systems. CRISPR, an acronym for Clustered Regularly Interspaced Short Palindromic Repeats, is prokaryotic immunity system for foreign DNA, mostly from phage. CRISPR systems belong to different subtypes, distinguished by both nature of the repeats, the makeup of the cohort of associated Cas proteins, and by molecular phylogeny within the more universal Cas proteins such as this one. This model is of type EXCEPTION and provides more specific information than the EQUIVALOG model TIGR00287. It describes the Cas1 protein particular to the DVULG subtype of CRISPR/Cas system.	8.25424e-171
CP019581.1\|AZK92350.1\|2072890_2073799_+\|Primosomal-protein-DnaI	gnl\|CDD\|236353	PRK08939, PRK08939, primosomal protein DnaI; Reviewed.	1.29781e-152
CP019581.1\|AZK92346.1\|2069625_2070456_+\|Formamidopyrimidine-DNA-glycosylase	gnl\|CDD\|234899	PRK01103, PRK01103, bifunctional DNA-formamidopyrimidine glycosylase/DNA-(apurinic or apyrimidinic site) lyase.	1.75738e-155
CP019581.1\|AZK92343.1\|2063605_2063896_+\|CRISPR-associated-endonuclease-Cas2	gnl\|CDD\|187856	cd09725, Cas2_I_II_III, CRISPR/Cas system-associated protein Cas2. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas2 is present in majority of CRISPR/Cas systems along with Cas1; RNAse specific to U-rich regions; Possesses an RRM/ferredoxin fold.	3.68589e-27
CP019581.1\|AZK92352.1\|2076115_2076487_+\|hypothetical-protein	gnl\|CDD\|226131	COG3603, COG3603, Uncharacterized conserved protein [Function unknown].	4.06666e-35
CP019581.1\|AZK92335.1\|2052474_2054016_+\|Bifunctional-purine-biosynthesis-protein-PurH	gnl\|CDD\|234854	PRK00881, purH, bifunctional phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase; Provisional.	0
CP019581.1\|AZK92334.1\|2051876_2052473_+\|Phosphoribosylglycinamide-formyltransferase	gnl\|CDD\|187714	cd08645, FMT_core_GART, Phosphoribosylglycinamide formyltransferase (GAR transformylase, GART). Phosphoribosylglycinamide formyltransferase, also known as GAR transformylase or GART, is an essential enzyme that catalyzes the third step in de novo purine biosynthesis. This enzyme uses formyl tetrahydrofolate as a formyl group donor to produce 5'-phosphoribosyl-N-formylglycinamide. In prokaryotes, GART is a single domain protein but in most eukaryotes it is the C-terminal portion of a large multifunctional protein which also contains GAR synthetase and aminoimidazole ribonucleotide synthetase activities.	9.45834e-93
CP019581.1\|AZK92338.1\|2058338_2059082_+\|CRISPR-associated-protein-Cas5	gnl\|CDD\|273847	TIGR01876, cas_Cas5d, CRISPR-associated protein Cas5, subtype I-C/DVULG. CRISPR is a term for Clustered, Regularly Interspaced Short Palidromic Repeats. A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins. This small Cas family is represented by CT1134 of Chlorobium tepidum. This family belongs to a set of several Cas protein families, one each for a number of different CRISPR/Cas subtypes, that share a region of N-terminal sequence similarity modeled by TIGR02593. This family represents the Dvulg subtype of CRISPR/Cas locus.	2.66247e-86
CP019581.1\|AZK92340.1\|2061057_2061909_+\|hypothetical-protein	gnl\|CDD\|187820	cd09689, Cas7_I-C, CRISPR/Cas system-associated RAMP superfamily protein Cas7. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) and associated Cas proteins comprise a system for heritable host defense by prokaryotic cells against phage and other foreign DNA; Cas7 is a RAMP superfamily protein; Subunit of the Cascade complex; also known as Csd2 family.	6.96291e-109
CP019581.1\|AZK92353.1\|2076493_2077744_+\|hypothetical-protein	gnl\|CDD\|377221	pfam04087, DUF389, Domain of unknown function (DUF389). Family of hypothetical bacterial proteins with an undetermined function.	7.09559e-51
CP019581.1\|AZK92341.1\|2061911_2062568_+\|PD-(D/E)XK-nuclease-superfamily-protein	gnl\|CDD\|273040	TIGR00372, conserved_hypothetical_protein, CRISPR-associated protein Cas4. This model represents a family of proteins associated with CRISPR repeats in a wide set of prokaryotic genomes. This scope of this model has been broadened since it was first built to describe an archaeal subset only. The function of the protein is undefined. Distantly related proteins, excluded from this model, include ORFs from Mycobacteriophage D29 and Sulfolobus islandicus filamentous virus and a region of the Schizosaccharomyces pombe DNA replication helicase Dna2p.	6.87674e-27
CP019581.1\|AZK92336.1\|2054028_2055288_+\|Phosphoribosylamine--glycine-ligase	gnl\|CDD\|234856	PRK00885, PRK00885, phosphoribosylamine--glycine ligase; Provisional.	0
CP019581.1\|AZK92345.1\|2066953_2069617_+\|DNA-polymerase-I	gnl\|CDD\|235591	PRK05755, PRK05755, DNA polymerase I; Provisional.	0
CP019581.1\|AZK92337.1\|2055789_2058324_+\|helicase-Cas3	gnl\|CDD\|224124	COG1203, COG1203, CRISPR-associated helicase Cas3 [Defense mechanisms].	2.63297e-58
CP019581.1\|AZK92349.1\|2071527_2072859_+\|Replication-initiation-and-membrane-attachment-protein	gnl\|CDD\|226138	COG3611, DnaB, Replication initiation/membrane attachment protein [DNA replication, recombination, and repair].	1.09245e-34
CP019581.1\|AZK92351.1\|2074089_2076024_+\|Threonine--tRNA-ligase	gnl\|CDD\|234752	PRK00413, thrS, threonyl-tRNA synthetase; Reviewed.	0
CP019581.1\|AZK92339.1\|2059081_2061055_+\|CRISPR-associated-protein-(Cas_Csd1)	gnl\|CDD\|378245	pfam09709, Cas_Csd1, CRISPR-associated protein (Cas_Csd1). CRISPR loci appear to be mobile elements with a wide host range. This entry represents proteins that tend to be found near CRISPR repeats. The species range, so far, is exclusively bacterial and mesophilic, although CRISPR loci are particularly common among the archaea and thermophilic bacteria. Clusters of short DNA repeats with nonhomologous spacers, which are found at regular intervals in the genomes of phylogenetically distinct prokaryotic species, comprise a family with recognisable features. This family is known as CRISPR (short for Clustered, Regularly Interspaced Short Palindromic Repeats). A number of protein families appear only in association with these repeats and are designated Cas (CRISPR-Associated) proteins.	2.97564e-90

>CP019581.1|AZK92343.1|2063605_2063896_+|CRISPR-associated-endonuclease-Cas2
MMVVVSYDINTESKSGQRRLRHVAKICLDYGQRVQNSVFECKVNSMQLELMKERLLDEIDDSQDSLYFFNLGKNYKNRIKSYGIKEVINLESPVIF
>CP019581.1|AZK92342.1|2062564_2063596_+|CRISPR-associated-protein-Cas4/endonuclease-Cas1-fusion
MRQLLNTLYINTPDSYLSSDGNNVVVKIKNNAVGRLPLQNFEAIVTFGYSGVSPSLMQKCLEQDISISFLSRTGRLKGRVVGEPTGNVYLRKTQFFNSENDAASLLIAKNMIIGKVYNHRWIIERFIRDHGMQIDRDKFKSISENLKNGLKDLQQVDTIDSLRRLEGSLANGYFSVFDDMIINQKDDFFYHGRSRRPPLDRLNALLSFSYSLLANECADALTTNGLDPYEGFMHVDRPGRKSLALDLMEELRGVIADRFVLRLVNKKEIHASDFVCKADGAYLLTDDARKSFLAKWQDNKISELEHPFLKEKIEWGLVPFAQAQLLARYLRGDLDEYPPFMWK
>CP019581.1|AZK92341.1|2061911_2062568_+|PD-(D/E)XK-nuclease-superfamily-protein
MSYDEKDYLMISGIQHFVFCKRQWALDHIENQWADNYLTVSGNRLHEKADDPYISETRGSKFVVRAMPIHSQEYGLTGIFDVVEFQKDTKGVQVFGKKEKYLPIPVEYKHGKSKIDDSDRLQVLAEAVCLEEMLFCHLDYGYLYYGRTRHREKVEFSEELRTELKKVISEMHYYWEKKYTPKVKVTKKCKSCSLRDICLPELLKRESVSNYISRKLNQ
>CP019581.1|AZK92340.1|2061057_2061909_+|hypothetical-protein
MVLSNKIDFKVYVAVHGANPNGDPLNGNRPRQTNDGFGEISDVAIKRKIRNRLQDMGHKIFVQSADRTDDGFKSLKDRADSIDAIKKAAKAKDADKYAEVACKNWMDVRSFGQVFAFKGDKLSVGVRGPVSIQTARSISPIFINEMQITKSVNSTTGDKKSSDTMGMKYSIDFAVYEFGGSINVQLAEKTGFSDDDAESIHKALETLFENDESSARPAGSMEVLRVYWWKHNSKLGQHSPAEMNRAVEIKNNNEPNAPRSLDDIEFIDKTPEDMKENEQIYEG
>CP019581.1|AZK92339.1|2059081_2061055_+|CRISPR-associated-protein-(Cas_Csd1)
MNWISDLAKVYDDNESIAGKAETVSVGKEKTKTVTLVPISHIAVNIPIQINLDKDGGFKGADVIDEKDNQRTIIPATLKSASRSSGSAPMPIDDTLKYIAKDYYPEISNKDKDSHYYSDYINQLKGFVEYVNNKNSSDRVRQQVNAIYTYVSQNDIFADLLFKAHLFGDEIKQVSAIPMKWTGKEEKPAVYKAITGDLDRSFVRFNVRGLGLDRSFEDPDLYEAWGKYYLTTLRNDTGVDYVDCNNDAILTDNHPKGIIPSASNAKLISANDTTNYTFKGRLLNSDEVATIGYLNSQKAHHALRWLIDKQGFSIGGRYYLAWGRKQQNYMIDNQTSPMFKILTSTYNTDQAESYTNERLAKSYYNSLVKGIELNGDNLEDLVYLMQIDTSTPGRADIVSYQALDLNQYIRKLSSWYGKISLFIQNKAGEFVDPPYSLRTIANMIHGSKANDDLKKNTISELISVILGSQIVPRGIIMPLYNKAIRPLSFNPKDPEARFIGWQPIVRLTSKLLKIWYENEGIKAMLNDEINDRSYLYGRLLAVADVLEGDALKNKEVDRPTNAQRYMSAFAQRPADTWKTIYMNAQPYFKQSKGNRRGQILIDHIFDKLQINEENINRLNDPLDGKFLIGYSQQKVDWFRKIREYSEKKQKEQEKGDK
>CP019581.1|AZK92338.1|2058338_2059082_+|CRISPR-associated-protein-Cas5
MLNEIIKSPSFSYKVFGDWALFTDPIMRLGGEKFTYSIPTYQALKGIAESVYWKPTIVIHIDKVRVMKPILVEAKDMRLFKYNNSRSSDLARYTYLKDVEYQVLAHFEFNMNRLDLAKDRNIKKHLAIMKRCIKRGGRRDVFLGTRECQGYVEPCKFGEGEGYYDNSDDRLFGTMFHGFDYPDETGNSMLKARLWNVVMKKGVVDFIRPEDCPVHKPLHELQVKKFKKGENLESVDQLYSQMLEGDS
>CP019581.1|AZK92337.1|2055789_2058324_+|helicase-Cas3
MVGNFIGHTKKLKNNTIETQSLRDHLLNTQKYAEKYASDLSLEHVAGLAGILHDLGKYQSKFQEYIIESTRKGDQSKKGSIDHSSFGAIFLRDFISENFSEKENYYDFLDFGGILENAIFSHHNYLGLKDYINPDLMSPFLNRIEKFKDDEEKKRQLKKCKELFYKDVITEEKFTKYFQLAFDEYEAFISKIRNKVTLKTEQILNENAKNNKQVMLELQAKYFLSEYVYSCLLDADRTDATAFKLSKNPNFSDNTELFEKYYSKLVGKLHKLNKNDNSKINQLRAEISEECDQAAERPSGIYTLSASTGSGKTLTSLRFGLKHAKLYHKKHIIYVLPYITIIEQNSEVIRKFLNDNKDDSQNILEFHSNVSQKVADKSEETTNALDLTEDSWDSPIIVTTMVQFLDSIFASGTKHRRRFHNLCDSIVIFDEVQKVPIKCLDMFNEAVNFLKNFGNTNVLLCTATQPALEEVKQKLDLNIDHEIIPNLIEHEQQFKRVEFIDKTQNDDGIDLVLNSIQAAELIFKKSQNFKSILGIFNTIDVTKKIYSNLKNKFDSISDQIKLEYLSTNMCPADRKERIKNVLNLVKEGKRVICISTPLIEAGVDASFECVFRSLSGLDSLVQAAGRCNRNNELKLGKVYLLNMDPSEEHIAKLNEVKTGKDQVLELLSEGIKADDFLNANVIKKYFEMFYSKLASTMSYPTNGINLENYIDGIKNVHELAYQSKRKDASKFEKLTQFSGSETIAKYFQVIKNNTKSVLAPYGDKGEKLIADLNGNQDINSLIMLVKDAQPYIVNLYDNKFNQLFEEGDIYTLCQVGNEVIYAFRPYAYNKLVLGDRKQIEKSIF
>CP019581.1|AZK92336.1|2054028_2055288_+|Phosphoribosylamine--glycine-ligase
MKDDLVLLVVGSGGREFAVAKKLQESPHVKTVYCAPGNVGMQTIGVETVPIEETDLDGLLDFAKSKHVDWTFVGPENVLCAGITDKFEKAGQKIFGPNQRAAQLEGSKDYALRFMNKYDVPTARHETFTSAETCIAGLKDFDFPVVIKEDGLAGGKGVTIAKNQDVAEETIREMFAGGQTAVVLEECLVGPEYSMFVVVSEDQFTILPMAQDHKRVGDGDKGPNTGGMGSYSPLPQLKKEDRQKMIDEIVKPTMNGLVQGNYHYCGVLYIGLMLTEDGPKVIEYNVRLGDPETQVVLPRVKNDFAELIDAAVNHEKLPEIEENDQSVLGVVVCSKGYPTHPAPNVKIGKLPEGTNTYIDYANVKGDLDNLTGDGGRLFMVISEADNLVQAQDNVYSYLSKLDLPDCFYRHDIGNRALRD
>CP019581.1|AZK92335.1|2052474_2054016_+|Bifunctional-purine-biosynthesis-protein-PurH
MKRALISVSDKTNLVDFAKGLVRNGYEIISTGGTKKTLDEAGIKTISVEEVTNFPEILDGRVKTLNPYIHGGLLAKRDDPEHMATLKKLNIQPIDLVCVNLYPFKQTIEKADVTREEAIENIDIGGPSLLRAASKNYQDVTVVTDKADYDLVLKEIEEKGNTTLETRAKLAAKVFRATAAYDAIIANYLTKQVGLEDPEKLTLTYDLKEKMRYGENSHQKAWLYEDAIPKSFSILQAHQLHGKKLSYNNIKDADEALRCIREFQDEPTVVAMKHMNPCGIGRGDTLEEAWDRAYEADSVSIFGGVIALNRKVDLATAEKMHKIFLEIIIAPGFDDDALAVLEKKKNVRLLELDFSKENEKTRPEVVSVMGGILQQEQDTLIENTDDWKVVTKAEPTAAQLKTMMFALKAVKHTKSNAIVVANDERTLGVGAGQPNRIDSAKIAINHAGDAIDDRAVLASDAFFPFNDCVEYAAKHGIKAIVQPGGSIRDKDSIEMADKYGVAMVFTGYRHFRH
>CP019581.1|AZK92334.1|2051876_2052473_+|Phosphoribosylglycinamide-formyltransferase
MRVAILASGNGTNFEALTKKFQAGEIPGTEALMFCNHPNAPVVKRAERLGIPHEAFSVKECGGKTAYEKRLLKVLQDYQIDFIVLSGYLRVVGPTILNEYPNAIINLHPALLPSYPGLNSIERAFEDYKQGKIKETGVTVHFIDAHLDHGPIIAQQAVPIYPDDTVETLEARVHETEHQLFPATLKKVLSQRMEKEEN
>CP019581.1|AZK92344.1|2066590_2066749_+|hypothetical-protein
MVAGVLGMFAFGYASWRGRQNVTLVIEDYEKKIAEIKKLDQNASGTEKIRFK
>CP019581.1|AZK92345.1|2066953_2069617_+|DNA-polymerase-I
MADKKLLLIDGNSVAFRAFYALYRQLESFKSPDGLHTNAIYAFKNMLDVLLKDVDPTHVLVAFDAGKVTFRTKMYGEYKGGRAKTPEELLEQMPYIQEMLHDLGIKTYELKNYEADDIIGTFAAKGEKAGFTTTIVTGDRDLTQLASDKTTVEVTKSGVSQLEAYTPEHMKEVNGVTPTEFIDMKALMGDNSDNYPGVEGIGPKTASNLIQEYGSVENLYDHIDEMKKSKRKERLIRDKDKAFLAKKLATIDRDSPVTIDIDDVKREPVDYEKLWQFYEKMNFRKFLAELNASGAGQDGAEVEKVEYTVLNDDNVKDVKATEKDTVEFYLEMLGANYHLADFVGFSLKINDKIYVSRDVDLLEEDNIKHILEDEKIKKNVFDLKRSMVGAHRLGIHTHGLDYDMLLASYLVNNENNSNDLGEIAHLYGDYSVKTDLEVYGKGKSEHIPDDDDELFNHLASKVNAIESLKKTLLEKLKDHEQDDLFDTIEIPTARVLAKMEINGMKVEASTLIQLQNEFAVKLQDLEKKIYQQAGEEFNLNSPKQLGHILFEKLGLPVLKKTKTGYSTSVEVLDQLKTQSPIVKEILDYRQIAKIQSTYVKGLLDVIQPDGRVHTRYLQTLTATGRLSSVDPNLQNIPTRTEEGKQIRKAFVPSDPDGYIFSCDYSQVELRVLAHVSGDQNMQEAFKTGYDIHSHTAMKIFHLESPDEVTPLMRRHAKAVNFGIVYGISDYGLSKNLGISRKRAQEFIDNYFEQYPQIKDYMNKAVQEARDKGYAETIMHRRRYLPDIHAKKYTVRAFAERTAINSPIQGSAADIIKIAMINMQKKLDELHLKTKMVVQVHDELIFDVPKDELETIKKIVPEVMQSAVKLDVPLIADSGWGHNWYDAK
>CP019581.1|AZK92346.1|2069625_2070456_+|Formamidopyrimidine-DNA-glycosylase
MPEMPEVETVRRTLIPLIKGKTIEKVILWYPKIVATDHEKFLSELPGKKIIDIDRYAKYLLIRLSDNLTIVSHLRMEGKYHLTTSDAPKDKHDHVEFIFTDGTALRYNDVRKFGRMQLILTGTERQTTGIGKLGYEPNSSEFTSEYLVNGLKRKKKNIKNTLLDQSVVAGLGNIYVDEVLWRTKIHPLSQANKIPAEKVIELHDQINQIITEAIKLQGTTVHSFLNANGQVGGFQSKLQVYGHVGEPCSVCGTKFEKIKVNGRGTTFCPHCQVIYK
>CP019581.1|AZK92347.1|2070452_2071055_+|Dephospho-CoA-kinase
MSYVLALTGGIATGKSTADDFFRKKNIPIIDCDQIAHELMEPGNASWQAIKDHFGMEYLNSDQTINRKKLGQLVFSNKQALSELNQVTHPLIFDKTVAKIKEYRDFALVILDVPVYFEAGLDKKHVANGVLVITLPEQLQIERLKKRNNLTDQEAINRINSQMPLVEKEKMADFVVANTGKIKELENKLEQILIKIREEE
>CP019581.1|AZK92348.1|2071057_2071525_+|Transcriptional-repressor-NrdR
MECPNCHQNASRVIDSRPSDENRAIRRRRECENCGFRFTTFERIETAPLLVIKNDGTREPFNRKKILHGVMAAGQKRPISSDQFEQLVDHVENKVRKQGISEISSKKIGQYVMDELADLDDVAYIRFASIYREFKDMSSFMKTMEDMMAKKGKGN
>CP019581.1|AZK92349.1|2071527_2072859_+|Replication-initiation-and-membrane-attachment-protein
MFETADPKHLYYVANRVRLFPEDEKVLIKLYQPLVGAVAVALYQTLIQNYDPYGIISDSKGIYSLQEQLDCSLKQLFNSLHKLEAVGLVQTFLSDNVFNNVLVFKLLQVPAADKFFATPLLASLLKEKVGVPTFHDLSHAFAQDAKLKEKPIKNAKDVSANFFDVFRLPGDEAITPSSDVVQAAQENKVHEVETAKVNDHDSIDWDFIKQEYSRYQIPASEIDLNKEQIRGLIQTYGLSEKEFVDESLPCLHGSYSLNMRDISNTLAENYKRTNTRENVQSQLNEGRKKALAAIKDMDDNDKKLLKAANESSPAEFLYKLKTQKGGITSANEKQIINNLHTQYGLPEDLINILTYTCLTYDTVVSSNLAYKIANDWLQHGVATAVQALQYVKKRRNSFGKKRPVRTYQKRVEKGTDWSKKKADRDAGISTEQLKNLFKDLNNK
>CP019581.1|AZK92350.1|2072890_2073799_+|Primosomal-protein-DnaI
MEPIDKVIKKIVKERNLGDEQSLISQALHDPDVQAFLTANANKIDQKMVQNSMSNLYEYYSQKHTANKVMAGYAPQLFLNGKVIDIRYVPTKAKLAQDRKQAAERRLQLIDVPTRLHDVSLSEIDVNDDRKQVLTLIYDFLRKYKQDPHVQGLYLSGDYGVGKTYILAGLANYVVTNMNKNVVFLHVPTFIAGLASHFDDNSLQSEIRRLSECDLLILDDIGAESLSQWSRDDVLGVILQARMDNVLPTFFSSNLDMEALESHFEETRNATDPVKARRLMQRVRFLAKEVVVSGPDRRNSLH
>CP019581.1|AZK92351.1|2074089_2076024_+|Threonine--tRNA-ligase
MSFSITLPDGSKKDFEESLTIADLAHNIATSLGKAAVAGKVNGELKPLDYKLDSDSEVAIITNKDEEGLDVLRATAAFVFEAVAKREYPELRLGEHVADEGGFYVDTDKDDQIKVGELPKLEKAMQKVIKNGEKIEHVQIAKSELEDLYKNDKFKSEVLAKVEGDTVDAYKLGDFVDFGFDALLPNTGKIKQFKLLSVAGAYWLGKSSNPMLQRIFGTAFFKEADLKADLKRRQEIKERDHRTIGRDLDLFFVDPKVGAGLPYWMPKGATIRRVVERYIIDREVADGYQHVYTPVLMNLDAYKTSGHWAHYRDDMFPPMDMGDGEMLELRPMNCPSHIQIFKHHIRSYRDLPLRVAELGMMHRYEKSGALSGLQRVREMTLNDGHTFVALDQVQTEFAKILKLIMDVYKDFDITDYYFRLSYRDPKNTDKYFANDEMWEKSQKMLKGAMDDLGLDYVEAEGEAAFYGPKLDIQTKTALGNDETMSTIQLDFMLPDRFGLTYVGKDGEEHRPVMIHRGIVGTMERFIAYLTEIYKGAFPTWLAPVQAEIIPVNNEAHGEYAEKVRAELAKRGFRVEVDDRNEKMGYKIRESQTQKVPYTLVLGDEEMKSGKVNVRCYGTDEEISKSLDDFINEIDADVKSYSREN
>CP019581.1|AZK92352.1|2076115_2076487_+|hypothetical-protein
MKLTIKKLPYQLTVCQLSDIKNLNLKNDFYFFAKTDEELSLVCENKNAPSKTINREDGWRAFKIEGQLDFSLIGILAKIAQLLANNGISIFAVSTFNTDYILVKDNNFDSAIKILSENNYEIK
>CP019581.1|AZK92353.1|2076493_2077744_+|hypothetical-protein
MSRKNYLSPQFLTKISEDGTLNIESLIILTCAIFIASIGLNVNSTATIIGAMLISPLMGPLLAIGTGLALYNTNILRKGAISLLAEIVISLVASTIYFHFSPLTYASQEIIARTSPTIWDVMIAFFGGSAGIIGARKKGANNIVPGVAIATALMPPLCTVGYSIAAGNLKYFLGSGYLFLINCVFITLTAFLGVKIMKWLSHSAGQPGLSFFRKPTLKETGIVLVVIILIIPNVLSAGHMVNKTLVDQNVQNLVAHELGDVDLIKENVDSQEKTINLTVSGKKINAKKIQAAKANLAEYNLKGYSLNIVQVAQVNPNAENQLDRQVNNILNQRQCEQEQANEERQQEQEKHNQEIEKLSPAISSVTAVSDNKNKQITLIELKKNISAKKKKALVKQIKEKYPNINLVEFVQESEKE

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Mismatch	Identity

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity
CP019581_3	3.4\|2064292\|34\|CP019581\|PILER-CR,CRISPRCasFinder,CRT	2064292-2064325	34	NC_013940	Deferribacter desulfuricans SSM1 megaplasmid pDF308, complete sequence	185122-185155	7	0.794
CP019581_3	3.4\|2064292\|34\|CP019581\|PILER-CR,CRISPRCasFinder,CRT	2064292-2064325	34	KY984068	Erwinia phage vB_EamM_Y3, complete genome	54331-54364	7	0.794
CP019581_3	3.7\|2064492\|35\|CP019581\|PILER-CR,CRISPRCasFinder,CRT	2064492-2064526	35	MH791414	UNVERIFIED: Aeromonas phage Aswh_1, complete genome	66400-66434	7	0.8
CP019581_3	3.7\|2064492\|35\|CP019581\|PILER-CR,CRISPRCasFinder,CRT	2064492-2064526	35	NZ_CP014003	Synechococcus sp. PCC 73109 plasmid unnamed5, complete sequence	162722-162756	8	0.771
CP019581_3	3.13\|2064893\|34\|CP019581\|PILER-CR,CRISPRCasFinder,CRT	2064893-2064926	34	AP014404	Uncultured Mediterranean phage uvMED isolate uvMED-CGF-C28-MedDCM-OCT-S28-C155, * SEQUENCING IN PROGRESS *, 3 ordered pieces	1499-1532	8	0.765
CP019581_3	3.6\|2064425\|35\|CP019581\|PILER-CR,CRISPRCasFinder,CRT	2064425-2064459	35	CP022016	Salmonella enterica subsp. enterica serovar India str. SA20085604 plasmid unnamed1, complete sequence	347087-347121	9	0.743
CP019581_3	3.7\|2064492\|35\|CP019581\|PILER-CR,CRISPRCasFinder,CRT	2064492-2064526	35	KC330683	Bacillus phage Finn, complete genome	48058-48092	9	0.743
CP019581_3	3.7\|2064492\|35\|CP019581\|PILER-CR,CRISPRCasFinder,CRT	2064492-2064526	35	NC_022765	Bacillus phage Riggi, complete genome	47777-47811	9	0.743
CP019581_3	3.7\|2064492\|35\|CP019581\|PILER-CR,CRISPRCasFinder,CRT	2064492-2064526	35	MT422786	Bacillus phage Novomoskovsk, complete genome	47051-47085	9	0.743
CP019581_3	3.8\|2064559\|35\|CP019581\|PILER-CR,CRISPRCasFinder,CRT	2064559-2064593	35	NZ_CP023678	Zymomonas mobilis subsp. mobilis strain ZM4 substr. 2032 plasmid pZM32, complete sequence	8876-8910	11	0.686
CP019581_3	3.8\|2064559\|35\|CP019581\|PILER-CR,CRISPRCasFinder,CRT	2064559-2064593	35	CP036466	Zymomonas mobilis strain ER79ag plasmid pER79ag32, complete sequence	8876-8910	11	0.686
CP019581_3	3.8\|2064559\|35\|CP019581\|PILER-CR,CRISPRCasFinder,CRT	2064559-2064593	35	CP036462	Zymomonas mobilis strain ZM4* plasmid pZM32o, complete sequence	8878-8912	11	0.686
CP019581_3	3.8\|2064559\|35\|CP019581\|PILER-CR,CRISPRCasFinder,CRT	2064559-2064593	35	CP036458	Zymomonas mobilis subsp. mobilis ZM4 = ATCC 31821 strain ZM4 plasmid pER79ap32, complete sequence	8876-8910	11	0.686

1. spacer 3.4|2064292|34|CP019581|PILER-CR,CRISPRCasFinder,CRT matches to NC_013940 (Deferribacter desulfuricans SSM1 megaplasmid pDF308, complete sequence) position: , mismatch: 7, identity: 0.794

atcgttatgcaggtattactactgctactaatac	CRISPR spacer
taacttatccagatattactactgctactaataa	Protospacer
    **** ***.********************

2. spacer 3.4|2064292|34|CP019581|PILER-CR,CRISPRCasFinder,CRT matches to KY984068 (Erwinia phage vB_EamM_Y3, complete genome) position: , mismatch: 7, identity: 0.794

atcgttatgcaggtattactactgct--actaatac	CRISPR spacer
atcgttatgcaggtgttcctactgatgaactagc--	Protospacer
**************.** ****** *  ****..

3. spacer 3.7|2064492|35|CP019581|PILER-CR,CRISPRCasFinder,CRT matches to MH791414 (UNVERIFIED: Aeromonas phage Aswh_1, complete genome) position: , mismatch: 7, identity: 0.8

gaaaggaaatatatatgtcagtcaaa--gttaatggt	CRISPR spacer
aaaaggaaaaatatatgtcaatcaaaagggttatg--	Protospacer
.******** **********.*****  * * ***

4. spacer 3.7|2064492|35|CP019581|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP014003 (Synechococcus sp. PCC 73109 plasmid unnamed5, complete sequence) position: , mismatch: 8, identity: 0.771

gaaaggaaatatatatgtcagtcaaagttaatggt	CRISPR spacer
gaaacgaaatttatatgtcagtcaaggggaaaagc	Protospacer
**** ***** **************.*  ** .*.

5. spacer 3.13|2064893|34|CP019581|PILER-CR,CRISPRCasFinder,CRT matches to AP014404 (Uncultured Mediterranean phage uvMED isolate uvMED-CGF-C28-MedDCM-OCT-S28-C155, *** SEQUENCING IN PROGRESS ***, 3 ordered pieces) position: , mismatch: 8, identity: 0.765

aagtgaatcgacaggtattgcagatgatgattta	CRISPR spacer
aactgctgaaacatctattgcagatgatgattta	Protospacer
** **    .***  *******************

6. spacer 3.6|2064425|35|CP019581|PILER-CR,CRISPRCasFinder,CRT matches to CP022016 (Salmonella enterica subsp. enterica serovar India str. SA20085604 plasmid unnamed1, complete sequence) position: , mismatch: 9, identity: 0.743

aattcattactggcattactccagtcactgcgcca	CRISPR spacer
cgcgcaatactggcaatactccagtcactatggca	Protospacer
 .. ** ******** *************..* **

7. spacer 3.7|2064492|35|CP019581|PILER-CR,CRISPRCasFinder,CRT matches to KC330683 (Bacillus phage Finn, complete genome) position: , mismatch: 9, identity: 0.743

gaaaggaaatatatatgtcagtcaaagttaatggt-----	CRISPR spacer
aaaaggaaaaatatatgtcactcaaaa-----ggtaccca	Protospacer
.******** ********** *****.     ***

8. spacer 3.7|2064492|35|CP019581|PILER-CR,CRISPRCasFinder,CRT matches to NC_022765 (Bacillus phage Riggi, complete genome) position: , mismatch: 9, identity: 0.743

gaaaggaaatatatatgtcagtcaaagttaatggt-----	CRISPR spacer
aaaaggaaaaatatatgtcactcaaaa-----ggtaccca	Protospacer
.******** ********** *****.     ***

9. spacer 3.7|2064492|35|CP019581|PILER-CR,CRISPRCasFinder,CRT matches to MT422786 (Bacillus phage Novomoskovsk, complete genome) position: , mismatch: 9, identity: 0.743

gaaaggaaatatatatgtcagtcaaagttaatggt-----	CRISPR spacer
aaaaggaaaaatatatgtcactcaaaa-----ggtaccca	Protospacer
.******** ********** *****.     ***

10. spacer 3.8|2064559|35|CP019581|PILER-CR,CRISPRCasFinder,CRT matches to NZ_CP023678 (Zymomonas mobilis subsp. mobilis strain ZM4 substr. 2032 plasmid pZM32, complete sequence) position: , mismatch: 11, identity: 0.686

gattttgttagaaaattaaccgatgattttttaca	CRISPR spacer
ccccatattagaaaagtaatcgatgattttttcgc	Protospacer
  .. *.******** ***.************

11. spacer 3.8|2064559|35|CP019581|PILER-CR,CRISPRCasFinder,CRT matches to CP036466 (Zymomonas mobilis strain ER79ag plasmid pER79ag32, complete sequence) position: , mismatch: 11, identity: 0.686

gattttgttagaaaattaaccgatgattttttaca	CRISPR spacer
ccccatattagaaaagtaatcgatgattttttcgc	Protospacer
  .. *.******** ***.************

12. spacer 3.8|2064559|35|CP019581|PILER-CR,CRISPRCasFinder,CRT matches to CP036462 (Zymomonas mobilis strain ZM4* plasmid pZM32o, complete sequence) position: , mismatch: 11, identity: 0.686

gattttgttagaaaattaaccgatgattttttaca	CRISPR spacer
ccccatattagaaaagtaatcgatgattttttcgc	Protospacer
  .. *.******** ***.************

13. spacer 3.8|2064559|35|CP019581|PILER-CR,CRISPRCasFinder,CRT matches to CP036458 (Zymomonas mobilis subsp. mobilis ZM4 = ATCC 31821 strain ZM4 plasmid pER79ap32, complete sequence) position: , mismatch: 11, identity: 0.686

gattttgttagaaaattaaccgatgattttttaca	CRISPR spacer
ccccatattagaaaagtaatcgatgattttttcgc	Protospacer
  .. *.******** ***.************

Prophage detection

Region

Region Position

Protein_number

Hit_taxonomy

Key_proteins

Att_site

Prophage annotation

DBSCAN-SWA_1

1183080 : 1222176

Lactobacillus_virus(40.0%)

transposase

The bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
AZK91455.1\|1183080_1184643_-\|transposase	Putative transposase DNA-binding domain protein	NA	NA	NA	NA
AZK91456.1\|1184596_1185247_-	hypothetical protein	A0A7Q0	Microcystis_virus	5.2e-40	45.2
AZK91457.1\|1185312_1185633_-	hypothetical protein	NA	NA	NA	NA
AZK91458.1\|1185984_1187160_-\|transposase	Putative transposase DNA-binding domain protein	Q5ULQ4	Lactobacillus_virus	1.0e-123	58.5
AZK91459.1\|1187288_1187558_-	Archaeal ATPase	NA	NA	NA	NA
AZK91460.1\|1187651_1188203_-	Murein DD-endopeptidase MepH precursor	M9MUG9	Rhodococcus_phage	3.4e-16	42.1
AZK91461.1\|1188394_1188940_-	Guanylate kinase	NA	NA	NA	NA
AZK91462.1\|1189034_1189334_+	hypothetical protein	NA	NA	NA	NA
AZK91463.1\|1189426_1190941_+	hypothetical protein	NA	NA	NA	NA
AZK91464.1\|1191017_1192208_-\|transposase	Putative transposase DNA-binding domain protein	Q5ULQ4	Lactobacillus_virus	1.5e-122	57.9
AZK91465.1\|1192387_1193011_-	hypothetical protein	NA	NA	NA	NA
AZK91466.1\|1193028_1193553_-	hypothetical protein	NA	NA	NA	NA
AZK91467.1\|1193792_1195034_-\|transposase	putative transposase	A0A0P0IJS6	Lactobacillus_phage	6.3e-119	57.0
AZK91468.1\|1195184_1195934_+	hypothetical protein	NA	NA	NA	NA
AZK91469.1\|1195985_1197176_-\|transposase	Putative transposase DNA-binding domain protein	Q5ULQ4	Lactobacillus_virus	4.8e-124	58.5
AZK91470.1\|1197522_1198008_-	hypothetical protein	NA	NA	NA	NA
AZK91471.1\|1198010_1198781_-	Inner membrane protein YjjP	NA	NA	NA	NA
AZK91472.1\|1198791_1200333_-	putative ABC transporter ATP-binding protein YheS	A0A2K9L3Z8	Tupanvirus	7.4e-45	28.6
AZK91473.1\|1200341_1200719_-	hypothetical protein	NA	NA	NA	NA
AZK91474.1\|1200852_1201410_+	Putative ribosomal N-acetyltransferase YdaF	NA	NA	NA	NA
AZK91475.1\|1201755_1202097_-	putative membrane protein YdfK	NA	NA	NA	NA
AZK91476.1\|1202167_1203409_-	Transcriptional regulator LytR	NA	NA	NA	NA
AZK91477.1\|1203570_1205367_+	Oligoendopeptidase F, plasmid	NA	NA	NA	NA
AZK91478.1\|1205370_1205634_+	hypothetical protein	NA	NA	NA	NA
AZK91479.1\|1205691_1206102_+	Fic/DOC family protein	NA	NA	NA	NA
AZK91480.1\|1206247_1206520_-	Enterocin A Immunity	NA	NA	NA	NA
AZK91481.1\|1206519_1206822_-	L-lactate permease	NA	NA	NA	NA
AZK91482.1\|1206775_1206991_-	L-lactate permease	NA	NA	NA	NA
AZK91483.1\|1206987_1207371_-	L-lactate permease	NA	NA	NA	NA
AZK91484.1\|1207352_1207850_-	L-lactate permease	NA	NA	NA	NA
AZK91485.1\|1208260_1209643_-	L-cystine uptake protein TcyP	NA	NA	NA	NA
AZK91486.1\|1210078_1210873_-	High-affinity zinc uptake system membrane protein ZnuB	NA	NA	NA	NA
AZK91487.1\|1210872_1211520_-	Zinc import ATP-binding protein ZnuC	G3M9Y6	Bacillus_virus	7.2e-18	29.6
AZK91488.1\|1211551_1212454_-	Metal ABC transporter substrate-binding lipoprotein precursor	NA	NA	NA	NA
AZK91489.1\|1212794_1214201_-	hypothetical protein	NA	NA	NA	NA
AZK91490.1\|1214337_1214610_-	HTH-type transcriptional repressor SmtB	NA	NA	NA	NA
AZK91491.1\|1214844_1216122_+	Transposase	A0A1S5SBP9	Streptococcus_phage	1.6e-45	31.1
AZK91492.1\|1216287_1218285_-	PTS system fructose-specific EIIABC component	NA	NA	NA	NA
AZK91493.1\|1218311_1219226_-	Tagatose-6-phosphate kinase	NA	NA	NA	NA
AZK91494.1\|1219225_1220002_-	Lactose phosphotransferase system repressor	NA	NA	NA	NA
AZK91495.1\|1220332_1220500_-	hypothetical protein	NA	NA	NA	NA
AZK91496.1\|1220480_1220696_-	hypothetical protein	NA	NA	NA	NA
AZK91497.1\|1220985_1222176_-\|transposase	Putative transposase DNA-binding domain protein	Q5ULQ4	Lactobacillus_virus	3.0e-126	58.7

DBSCAN-SWA_2

2043706 : 2052473

Synechococcus_phage(33.33%)

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
AZK92326.1\|2043706_2044192_+	N5-carboxyaminoimidazole ribonucleotide mutase	A0A2P0VNU7	Tetraselmis_virus	2.8e-22	46.4
AZK92327.1\|2044154_2045333_+	N5-carboxyaminoimidazole ribonucleotide synthase	NA	NA	NA	NA
AZK92328.1\|2045536_2046253_+	Phosphoribosylaminoimidazole-succinocarboxamide synthase	G8EYA2	Synechococcus_phage	3.7e-39	38.3
AZK92329.1\|2046253_2046508_+	phosphoribosylformylglycinamidine synthase subunit PurS	NA	NA	NA	NA
AZK92330.1\|2046504_2047176_+	Phosphoribosylformylglycinamidine synthase 1	NA	NA	NA	NA
AZK92331.1\|2047172_2049401_+	Phosphoribosylformylglycinamidine synthase 2	A6N228	Microbacterium_phage	2.3e-143	39.7
AZK92332.1\|2049376_2050828_+	Amidophosphoribosyltransferase precursor	A0A0M3SGR2	Mollivirus	5.3e-61	34.4
AZK92333.1\|2050829_2051867_+	Phosphoribosylformylglycinamidine cyclo-ligase	Q58MH8	Prochlorococcus_phage	1.5e-60	41.2
AZK92334.1\|2051876_2052473_+	Phosphoribosylglycinamide formyltransferase	M4QRX9	Synechococcus_phage	3.1e-31	38.3

Anti-CRISPR protein detection

Acr ID	Acr position	Acr size	Homology with known anti	Neighbor HTH/AcRanker	Neighbor Aca	In prophage	Protospacer in prophage

2. CP019583

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Crispr_ID: CP019583_1

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

CP019583_1

4548-4703

Orphan

Consensus_repeat	Method
AAACCCTTGCTACGAGCGAAAGTCTAAAAAATAGAC	CRISPRCasFinder

1 spacers

The CRISPR arrays of CP019583_1

>merge|CP019583|1|4548-4703|CRISPRCasFinder
AAACCCTTGCTACGAGCGAAAGTCTAAAAAATAGACCTTCGCGGGAGACCGTTGAAACCCTTGCTACGAGCGAAAGTCTAAAAAATAGACCTTCGCGAAAGTCCGTTGATGACAACCCGCAAACCCTTGCTACGAGCGAAAGTCTAAAAAATAGAC

>CP019583|1|1|4548-4703|CRISPRCasFinder
AAACCCTTGCTACGAGCGAAAGTCTAAAAAATAGAC	CTTCGCGGGAGACCGTTGAAACCCTTGCTACGAGCGAAAGTCTAAAAAATAGACCTTCGCGAAAGTCCGTTGATGACAACCCGC
AAACCCTTGCTACGAGCGAAAGTCTAAAAAATAGAC

Protein	Function_ID	Function_description	E-value
CP019583.1\|AZK92450.1\|959_1262_+\|mRNA-interferase-YafQ	gnl\|CDD\|379750	pfam15738, YafQ_toxin, Bacterial toxin of type II toxin-antitoxin system, YafQ. YafQ is a family of bacterial toxin ribonucleases of type II toxin-antitoxin systems. The E.coli gene is expressed from the dinB operon. The cognate antitoxin for the E. coli protein is DinJ, in family RelB_antitoxin, pfam02604.	5.70318e-24
CP019583.1\|AZK92453.1\|2969_3533_-\|hypothetical-protein	gnl\|CDD\|374328	pfam16046, FAM76, FAM76 protein. This family of proteins is functionally uncharacterized. This family of proteins is found in eukaryotes. Proteins in this family are typically between 233 and 341 amino acids in length.	0.00170872
CP019583.1\|AZK92448.1\|0_588_-\|site-specific-tyrosine-recombinase-XerC	gnl\|CDD\|271192	cd01192, INT_C_like_3, Uncharacterized site-specific tyrosine recombinase, C-terminal catalytic domain. Tyrosine recombinase (integrase) belongs to a DNA breaking-rejoining enzyme superfamily. The catalytic domain contains six conserved active site residues. The recombination reaction involves cleavage of a single strand of a DNA duplex by nucleophilic attack of a conserved tyrosine to give a 3' phosphotyrosyl protein-DNA adduct. In the second rejoining step, a terminal 5' hydroxyl attacks the covalent adduct to release the enzyme and generate duplex DNA. Many DNA breaking-rejoining enzymes also have N-terminal domains, which show little sequence or structure similarity.	1.96664e-72
CP019583.1\|AZK92454.1\|5434_5629_+\|hypothetical-protein	gnl\|CDD\|375483	pfam18008, Bac_RepA_C, Replication initiator protein A C-terminal domain. This is the C-terminal domain (CTD) that can be found in the conserved replication initiator, RepA,essential for staphylococcal propagation. RepA CTD shared the strongest structural homology to the Enterococcus faecalis DnaD CTD, yet perform distinct functions. RepA CTD shows strong sequence homology between RepA_N plasmids in genus-specific clusters, suggesting that it may perform host-specific functions necessary for replication. The RepA CTD interacts with the host DnaG primase, which binds the replicative helicase. Structural data indicate that the RepA CTD exists as a monomeric entity, flexibly tethered to the DNA-bound NTD.	1.22522e-12
CP019583.1\|AZK92449.1\|691_970_+\|hypothetical-protein	gnl\|CDD\|225619	COG3077, RelB, DNA-damage-inducible protein J [DNA replication, recombination, and repair].	0.0001731

>CP019583.1|AZK92453.1|2969_3533_-|hypothetical-protein
MAKTIKQLADELKVSKQTIQYHYQRLPAKNQQKNSQGTNLISTTAERIIRSKVAKPLLANKQQIGSKEPTKTSKENNDLIITLRREVEDLKSQRDKQLAAKDQQISSKDRQIDHLTKLIDQQQQLQLAIVAENRQLKEHVQKLSGLLEPSSTTQQQQSNDKDDALSNSEKQKRMHKNKPNKNWWHFW
>CP019583.1|AZK92452.1|2613_2841_-|hypothetical-protein
MLNQQLAIKDSQIKEKDEQLNSMQKLLDQSQQLQLMTEKKVEELETTTSIKIKYDNLNLKQKSNAWWKFWLKNKT
>CP019583.1|AZK92451.1|1386_2145_-|hypothetical-protein
MDNKSNKDALSLIKKNQAETGYEGSIQEYEQLYSLFVNHGYKQAQVAFARLSDISNYLPLLKSGPLSLYILYVLKANNDRGSSFWSIDALAKKLQTTTKSITNWNTKLIDLGLIRRLKGLGKSTTTVLLPTSPIIINKKTQESIKLLEKINYKLQAYVIFKKDNKYITYRFFESNIKYKINNPIIILSVEEDMISDISDSQTAYTDIDAVDGSKIDEITQLLLETEISGSESTKTKEKIKLLVDLYQTYLRK
>CP019583.1|AZK92450.1|959_1262_+|mRNA-interferase-YafQ
MQIKQTKSFERELKKLVKKHFPITVLKPCLEAIVEQDVLVLKQIKDHALKGNWRGYREFHPARYGNYGKNYDNWIVIYQLDHDELILLLVATGSHEILNQ
>CP019583.1|AZK92449.1|691_970_+|hypothetical-protein
MSNTIIKNKTISTRVTPDISERAKANLAKQGLTVSEYIRLSLVKAANNEVRLVSFLDSPEALAAKKEAETGQVKNIGSLTDFEDWIDKLDAN
>CP019583.1|AZK92448.1|0_588_-|site-specific-tyrosine-recombinase-XerC
MQQVVLPIKDSNVLKEVQDTLLNNFKAGRRNYTIFQVGKATLLRVSDVMGLKQADIFNPDGSIKQNAFIHDRKTGKPNTLYLKPVQTELLLYRQWLLDHKLDSEWLFPSIQHPERHITEKQFYKIMSKVGDLLGINYLGTHTMRKTGAYRVYTQSNYNIGLVMHLLNHSSEAMTLAYLGLDQASTENMLNQIDFG
>CP019583.1|AZK92454.1|5434_5629_+|hypothetical-protein
MTKALRRYFNALRSNEKHIKNVENYLYGTMTNLFGIYWNKLAGAKYRAQHPEEFKNQEALSDWL
>CP019583.1|AZK92455.1|5912_6065_+|hypothetical-protein
MSKKIWMIIFRYLLAIGLFLAYSAIFDNQDHDLIIKYCFCYMSWPCYYSI

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Mismatch	Identity

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity
CP019583_1	1.1\|4584\|84\|CP019583\|CRISPRCasFinder	4584-4667	84	NZ_CP019583	Lactobacillus helveticus strain LH5 plasmid pCBTLH5_2, complete sequence	4584-4667	24	0.714
CP019583_1	1.1\|4584\|84\|CP019583\|CRISPRCasFinder	4584-4667	84	NC_014386	Lactobacillus helveticus R0052 plasmid pIR52-1, complete sequence	1748-1831	24	0.714
CP019583_1	1.1\|4584\|84\|CP019583\|CRISPRCasFinder	4584-4667	84	NZ_CP017358	Lactobacillus plantarum strain TMW 1.25 plasmid pL125-4, complete sequence	4776-4859	24	0.714
CP019583_1	1.1\|4584\|84\|CP019583\|CRISPRCasFinder	4584-4667	84	NZ_CP014934	Pediococcus claussenii strain TMW 2.53 plasmid pL253-1, complete sequence	5879-5962	24	0.714
CP019583_1	1.1\|4584\|84\|CP019583\|CRISPRCasFinder	4584-4667	84	NZ_CP014937	Pediococcus claussenii strain TMW 2.54 plasmid pL254-1, complete sequence	5880-5963	24	0.714
CP019583_1	1.1\|4584\|84\|CP019583\|CRISPRCasFinder	4584-4667	84	NZ_CP014913	Lactobacillus paracollinoides strain TMW 1.1979 plasmid pL11979-1, complete sequence	22508-22591	24	0.714
CP019583_1	1.1\|4584\|84\|CP019583\|CRISPRCasFinder	4584-4667	84	NZ_CP017368	Lactobacillus plantarum strain TMW 1.277 plasmid pL1277-5, complete sequence	5770-5853	24	0.714
CP019583_1	1.1\|4584\|84\|CP019583\|CRISPRCasFinder	4584-4667	84	NZ_CP017265	Lactobacillus paracasei strain FAM18149 plasmid pFAM18149.24, complete sequence	26504-26587	24	0.714
CP019583_1	1.1\|4584\|84\|CP019583\|CRISPRCasFinder	4584-4667	84	NZ_CP017960	Lactobacillus plantarum strain C410L1 plasmid unnamed6, complete sequence	6891-6974	24	0.714
CP019583_1	1.1\|4584\|84\|CP019583\|CRISPRCasFinder	4584-4667	84	NZ_CP017960	Lactobacillus plantarum strain C410L1 plasmid unnamed6, complete sequence	20910-20993	24	0.714
CP019583_1	1.1\|4584\|84\|CP019583\|CRISPRCasFinder	4584-4667	84	NC_006529	Lactobacillus salivarius UCC118 plasmid pSF118-20, complete sequence	4742-4825	24	0.714
CP019583_1	1.1\|4584\|84\|CP019583\|CRISPRCasFinder	4584-4667	84	MK994179	Lactobacillus plantarum strain PC518 plasmid plp75TA, complete sequence	4831-4914	25	0.702

1. spacer 1.1|4584|84|CP019583|CRISPRCasFinder matches to NZ_CP019583 (Lactobacillus helveticus strain LH5 plasmid pCBTLH5_2, complete sequence) position: , mismatch: 24, identity: 0.714

cttcgcgggagaccgttgaaacccttgctacgagcgaaagtctaaaaaatagaccttcgc	CRISPR spacer
cttcgcgggagaccgttgaaacccttgctacgagcgaaagtctaaaaaatagaccttcgc	Protospacer
************************************************************

2. spacer 1.1|4584|84|CP019583|CRISPRCasFinder matches to NC_014386 (Lactobacillus helveticus R0052 plasmid pIR52-1, complete sequence) position: , mismatch: 24, identity: 0.714

cttcgcgggagaccgttgaaacccttgctacgagcgaaagtctaaaaaatagaccttcgc	CRISPR spacer
cttcgcgggagaccgttgaaacccttgctacgagcgaaagtctaaaaaatagaccttcgc	Protospacer
************************************************************

3. spacer 1.1|4584|84|CP019583|CRISPRCasFinder matches to NZ_CP017358 (Lactobacillus plantarum strain TMW 1.25 plasmid pL125-4, complete sequence) position: , mismatch: 24, identity: 0.714

cttcgcgggagaccgttgaaacccttgctacgagcgaaagtctaaaaaatagaccttcgc	CRISPR spacer
cttcgcgggagaccgttgaaacccttgctacgagcgaaagtctaaaaaatagaccttcgc	Protospacer
************************************************************

4. spacer 1.1|4584|84|CP019583|CRISPRCasFinder matches to NZ_CP014934 (Pediococcus claussenii strain TMW 2.53 plasmid pL253-1, complete sequence) position: , mismatch: 24, identity: 0.714

cttcgcgggagaccgttgaaacccttgctacgagcgaaagtctaaaaaatagaccttcgc	CRISPR spacer
cttcgcgggagaccgttgaaacccttgctacgagcgaaagtctaaaaaatagaccttcgc	Protospacer
************************************************************

5. spacer 1.1|4584|84|CP019583|CRISPRCasFinder matches to NZ_CP014937 (Pediococcus claussenii strain TMW 2.54 plasmid pL254-1, complete sequence) position: , mismatch: 24, identity: 0.714

cttcgcgggagaccgttgaaacccttgctacgagcgaaagtctaaaaaatagaccttcgc	CRISPR spacer
cttcgcgggagaccgttgaaacccttgctacgagcgaaagtctaaaaaatagaccttcgc	Protospacer
************************************************************

6. spacer 1.1|4584|84|CP019583|CRISPRCasFinder matches to NZ_CP014913 (Lactobacillus paracollinoides strain TMW 1.1979 plasmid pL11979-1, complete sequence) position: , mismatch: 24, identity: 0.714

cttcgcgggagaccgttgaaacccttgctacgagcgaaagtctaaaaaatagaccttcgc	CRISPR spacer
cttcgcgggagaccgttgaaacccttgctacgagcgaaagtctaaaaaatagaccttcgc	Protospacer
************************************************************

7. spacer 1.1|4584|84|CP019583|CRISPRCasFinder matches to NZ_CP017368 (Lactobacillus plantarum strain TMW 1.277 plasmid pL1277-5, complete sequence) position: , mismatch: 24, identity: 0.714

cttcgcgggagaccgttgaaacccttgctacgagcgaaagtctaaaaaatagaccttcgc	CRISPR spacer
cttcgcgggagaccgttgaaacccttgctacgagcgaaagtctaaaaaatagaccttcgc	Protospacer
************************************************************

8. spacer 1.1|4584|84|CP019583|CRISPRCasFinder matches to NZ_CP017265 (Lactobacillus paracasei strain FAM18149 plasmid pFAM18149.24, complete sequence) position: , mismatch: 24, identity: 0.714

cttcgcgggagaccgttgaaacccttgctacgagcgaaagtctaaaaaatagaccttcgc	CRISPR spacer
cttcgcgggagaccgttgaaacccttgctacgagcgaaagtctaaaaaatagaccttcgc	Protospacer
************************************************************

9. spacer 1.1|4584|84|CP019583|CRISPRCasFinder matches to NZ_CP017960 (Lactobacillus plantarum strain C410L1 plasmid unnamed6, complete sequence) position: , mismatch: 24, identity: 0.714

cttcgcgggagaccgttgaaacccttgctacgagcgaaagtctaaaaaatagaccttcgc	CRISPR spacer
cttcgcgggagaccgttgaaacccttgctacgagcgaaagtctaaaaaatagaccttcgc	Protospacer
************************************************************

10. spacer 1.1|4584|84|CP019583|CRISPRCasFinder matches to NZ_CP017960 (Lactobacillus plantarum strain C410L1 plasmid unnamed6, complete sequence) position: , mismatch: 24, identity: 0.714

cttcgcgggagaccgttgaaacccttgctacgagcgaaagtctaaaaaatagaccttcgc	CRISPR spacer
cttcgcgggagaccgttgaaacccttgctacgagcgaaagtctaaaaaatagaccttcgc	Protospacer
************************************************************

11. spacer 1.1|4584|84|CP019583|CRISPRCasFinder matches to NC_006529 (Lactobacillus salivarius UCC118 plasmid pSF118-20, complete sequence) position: , mismatch: 24, identity: 0.714

cttcgcgggagaccgttgaaacccttgctacgagcgaaagtctaaaaaatagaccttcgc	CRISPR spacer
cttcgcgggagaccgttgaaacccttgctacgagcgaaagtctaaaaaatagaccttcgc	Protospacer
************************************************************

12. spacer 1.1|4584|84|CP019583|CRISPRCasFinder matches to MK994179 (Lactobacillus plantarum strain PC518 plasmid plp75TA, complete sequence) position: , mismatch: 25, identity: 0.702

cttcgcgggagaccgttgaaacccttgctacgagcgaaagtctaaaaaatagaccttcgc	CRISPR spacer
cttcgcgggagaccgttgaaacccttgctacaagcgaaagtctaaaaaatagaccttcgc	Protospacer
*******************************.****************************

Prophage detection

Region	Region Position	Protein_number	Hit_taxonomy	Key_proteins	Att_site	Prophage annotation

Anti-CRISPR protein detection

Acr ID	Acr position	Acr size	Homology with known anti	Neighbor HTH/AcRanker	Neighbor Aca	In prophage	Protospacer in prophage

Overview of predicted results

Overview of the results

Cas Category Instructions

Results visualization

1. CP019581

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection

2. CP019583

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Click the colored protein region to show detailed information

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection