CRISPRimmunity

Please click to download your results

Overview of predicted results

Overview of the results

Contig_ID	Contig_def	CRISPR array number	Contig Signature genes	Self targeting spacer number	Target MGE spacer number	Prophage number	Anti-CRISPR protein number
NZ_CP050153	Brevibacterium sp. YB235 chromosome, complete genome	3 crisprs	WYL,csa3,cas3,DEDDh,cas4,DinG	0	2	2	0

Results visualization

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Crispr_ID: NZ_CP050153_1

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP050153_1

1679004-1679075

Orphan

Consensus_repeat	Method
GAGGATCGATGAACGCTGGCCGG	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_CP050153_1

>merge|NZ_CP050153|1|1679004-1679075|CRISPRCasFinder
GAGGATCGATGAACGCTGGCCGGCTTGAACGAGGTAGCCCGGGTGGGCGGAGGATCGATGAACGCTGGCCGA

>NZ_CP050153|1|1|1679004-1679075|CRISPRCasFinder
GAGGATCGATGAACGCTGGCCGG	CTTGAACGAGGTAGCCCGGGTGGGCG
GAGGATCGATGAACGCTGGCCGA

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP050153.1\|WP_167195782.1\|1680285_1681929_-\|cell-division-protein	unknown	unknown	gnl\|CDD\|173412
NZ_CP050153.1\|WP_025776911.1\|1675429_1675690_+\|F0F1-ATP-synthase-subunit-epsilon	unknown	unknown	gnl\|CDD\|184055
NZ_CP050153.1\|WP_167195793.1\|1686059_1687640_+\|ABC-transporter	unknown	unknown	gnl\|CDD\|206743
NZ_CP050153.1\|WP_167195770.1\|1671351_1672986_+\|F0F1-ATP-synthase-subunit-alpha	unknown	unknown	gnl\|CDD\|236448
NZ_CP050153.1\|WP_167195802.1\|1689463_1691146_+\|energy-dependent-translational-throttle-protein-EttA	unknown	unknown	gnl\|CDD\|236992
NZ_CP050153.1\|WP_167195784.1\|1682160_1683351_+\|acetyl-CoA-C-acetyltransferase	unknown	unknown	gnl\|CDD\|180261
NZ_CP050153.1\|WP_167195773.1\|1676179_1677493_+\|UDP-N-acetylglucosamine-1-carboxyvinyltransferase	unknown	unknown	gnl\|CDD\|236486
NZ_CP050153.1\|WP_062242329.1\|1668840_1669587_+\|F0F1-ATP-synthase-subunit-A	unknown	unknown	gnl\|CDD\|235617
NZ_CP050153.1\|WP_167195779.1\|1679122_1679818_-\|endonuclease-NucS	unknown	unknown	gnl\|CDD\|235114
NZ_CP050153.1\|WP_098730992.1\|1673017_1673950_+\|F0F1-ATP-synthase-subunit-gamma	unknown	unknown	gnl\|CDD\|235535
NZ_CP050153.1\|WP_167195776.1\|1677900_1678905_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|380141
NZ_CP050153.1\|WP_167195799.1\|1688611_1689355_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|273344
NZ_CP050153.1\|WP_039210675.1\|1669668_1669893_+\|F0F1-ATP-synthase-subunit-C	unknown	unknown	gnl\|CDD\|169138
NZ_CP050153.1\|WP_167200788.1\|1679926_1680145_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP050153.1\|WP_167195796.1\|1687831_1688512_+\|single-stranded-DNA-binding-protein	unknown	unknown	gnl\|CDD\|239942
NZ_CP050153.1\|WP_167195790.1\|1684365_1686063_+\|hypothetical-protein	unknown	unknown	gnl\|CDD\|206739
NZ_CP050153.1\|WP_025776910.1\|1675712_1676180_+\|DUF2550-family-protein	unknown	unknown	gnl\|CDD\|378486
NZ_CP050153.1\|WP_039210678.1\|1669912_1670464_+\|F0F1-ATP-synthase-subunit-B	unknown	unknown	gnl\|CDD\|180240
NZ_CP050153.1\|WP_167195767.1\|1670463_1671270_+\|F0F1-ATP-synthase-subunit-delta	unknown	unknown	gnl\|CDD\|237387
NZ_CP050153.1\|WP_167195787.1\|1683840_1684047_+\|hypothetical-protein	unknown	unknown	unknown

Protein	Function_ID	Function_description	E-value
NZ_CP050153.1\|WP_167195782.1\|1680285_1681929_-\|cell-division-protein	gnl\|CDD\|173412	PTZ00121, PTZ00121, MAEBL; Provisional.	1.88251e-08
NZ_CP050153.1\|WP_025776911.1\|1675429_1675690_+\|F0F1-ATP-synthase-subunit-epsilon	gnl\|CDD\|184055	PRK13442, atpC, F0F1 ATP synthase subunit epsilon; Provisional.	6.05767e-32
NZ_CP050153.1\|WP_167195793.1\|1686059_1687640_+\|ABC-transporter	gnl\|CDD\|206743	cd11383, YfjP, YfjP GTPase. The Era (E. coli Ras-like protein)-like YfjP subfamily includes several uncharacterized bacterial GTPases that are similar to Era. They generally show sequence conservation in the region between the Walker A and B motifs (G1 and G3 box motifs), to the exclusion of other GTPases. Era is characterized by a distinct derivative of the KH domain (the pseudo-KH domain) which is located C-terminal to the GTPase domain.	1.68099e-31
NZ_CP050153.1\|WP_167195770.1\|1671351_1672986_+\|F0F1-ATP-synthase-subunit-alpha	gnl\|CDD\|236448	PRK09281, PRK09281, F0F1 ATP synthase subunit alpha; Validated.	0
NZ_CP050153.1\|WP_167195802.1\|1689463_1691146_+\|energy-dependent-translational-throttle-protein-EttA	gnl\|CDD\|236992	PRK11819, PRK11819, putative ABC transporter ATP-binding protein; Reviewed.	0
NZ_CP050153.1\|WP_167195784.1\|1682160_1683351_+\|acetyl-CoA-C-acetyltransferase	gnl\|CDD\|180261	PRK05790, PRK05790, putative acyltransferase; Provisional.	0
NZ_CP050153.1\|WP_167195773.1\|1676179_1677493_+\|UDP-N-acetylglucosamine-1-carboxyvinyltransferase	gnl\|CDD\|236486	PRK09369, PRK09369, UDP-N-acetylglucosamine 1-carboxyvinyltransferase; Validated.	0
NZ_CP050153.1\|WP_062242329.1\|1668840_1669587_+\|F0F1-ATP-synthase-subunit-A	gnl\|CDD\|235617	PRK05815, PRK05815, F0F1 ATP synthase subunit A; Validated.	1.3597e-46
NZ_CP050153.1\|WP_167195779.1\|1679122_1679818_-\|endonuclease-NucS	gnl\|CDD\|235114	PRK03298, PRK03298, endonuclease NucS.	7.50807e-167
NZ_CP050153.1\|WP_098730992.1\|1673017_1673950_+\|F0F1-ATP-synthase-subunit-gamma	gnl\|CDD\|235535	PRK05621, PRK05621, F0F1 ATP synthase subunit gamma; Validated.	2.57004e-122
NZ_CP050153.1\|WP_167195776.1\|1677900_1678905_+\|hypothetical-protein	gnl\|CDD\|380141	pfam18741, MTES_1575, REase_MTES_1575. Vsr REase Fold. Fused to HEPN (SWT1/Abi2 family), along with Transglutaminase and wHTH.	7.40807e-05
NZ_CP050153.1\|WP_167195799.1\|1688611_1689355_+\|hypothetical-protein	gnl\|CDD\|273344	TIGR00927, retinal_rod, K+-dependent Na+/Ca+ exchanger. [Transport and binding proteins, Cations and iron carrying compounds].	0.000115378
NZ_CP050153.1\|WP_039210675.1\|1669668_1669893_+\|F0F1-ATP-synthase-subunit-C	gnl\|CDD\|169138	PRK07874, PRK07874, ATP synthase F0 subunit C.	1.5483e-20
NZ_CP050153.1\|WP_167195796.1\|1687831_1688512_+\|single-stranded-DNA-binding-protein	gnl\|CDD\|239942	cd04496, SSB_OBF, SSB_OBF: A subfamily of OB folds similar to the OB fold of ssDNA-binding protein (SSB). SSBs bind with high affinity to ssDNA. They bind to and protect ssDNA intermediates during DNA metabolic pathways. All bacterial and eukaryotic SSBs studied to date oligomerize to bring together four OB folds in their active state. The majority (e.g. Escherichia coli SSB) have a single OB fold per monomer, which oligomerize to form a homotetramer. However, Deinococcus and Thermus SSB proteins have two OB folds per monomer, which oligomerize to form a homodimer. Mycobacterium tuberculosis SSB varies in quaternary structure from E. coli SSB. It forms a dimer of dimers having a unique dimer interface, which lends the protein greater stability. Included in this group are OB folds similar to Escherichia coli PriB. E.coli PriB is homodimeric with each monomer having a single OB fold. It does not appear to form higher order oligomers. PriB is an essential protein for the replication restart at forks that have stalled at sites of DNA damage. It also plays a role in the assembly of primosome during replication initiation at the bacteriophage phiX174 origin. PriB physically interacts with SSB and binds ssDNA with high affinity.	1.2433e-23
NZ_CP050153.1\|WP_167195790.1\|1684365_1686063_+\|hypothetical-protein	gnl\|CDD\|206739	cd09912, DLP_2, Dynamin-like protein including dynamins, mitofusins, and guanylate-binding proteins. The dynamin family of large mechanochemical GTPases includes the classical dynamins and dynamin-like proteins (DLPs) that are found throughout the Eukarya. This family also includes bacterial DLPs. These proteins catalyze membrane fission during clathrin-mediated endocytosis. Dynamin consists of five domains; an N-terminal G domain that binds and hydrolyzes GTP, a middle domain (MD) involved in self-assembly and oligomerization, a pleckstrin homology (PH) domain responsible for interactions with the plasma membrane, GED, which is also involved in self-assembly, and a proline arginine rich domain (PRD) that interacts with SH3 domains on accessory proteins. To date, three vertebrate dynamin genes have been identified; dynamin 1, which is brain specific, mediates uptake of synaptic vesicles in presynaptic terminals; dynamin-2 is expressed ubiquitously and similarly participates in membrane fission; mutations in the MD, PH and GED domains of dynamin 2 have been linked to human diseases such as Charcot-Marie-Tooth peripheral neuropathy and rare forms of centronuclear myopathy. Dynamin 3 participates in megakaryocyte progenitor amplification, and is also involved in cytoplasmic enlargement and the formation of the demarcation membrane system. This family also includes mitofusins (MFN1 and MFN2 in mammals) that are involved in mitochondrial fusion. Dynamin oligomerizes into helical structures around the neck of budding vesicles in a GTP hydrolysis-dependent manner.	8.61859e-12
NZ_CP050153.1\|WP_025776910.1\|1675712_1676180_+\|DUF2550-family-protein	gnl\|CDD\|378486	pfam10739, DUF2550, Protein of unknown function (DUF2550). This family is conserved in Corynebacterineae. The function is not known though most members are annotated as either secreted, or membrane, proteins.	1.95946e-27
NZ_CP050153.1\|WP_039210678.1\|1669912_1670464_+\|F0F1-ATP-synthase-subunit-B	gnl\|CDD\|180240	PRK05759, PRK05759, F0F1 ATP synthase subunit B; Validated.	1.41499e-47
NZ_CP050153.1\|WP_167195767.1\|1670463_1671270_+\|F0F1-ATP-synthase-subunit-delta	gnl\|CDD\|237387	PRK13430, PRK13430, F0F1 ATP synthase subunit delta; Provisional.	1.97678e-75

>NZ_CP050153.1|WP_167195776.1|1677900_1678905_+|hypothetical-protein
MLEGMYVCLSTAALLAAGWDRHPIKAAERCCLRRLERGRYVVTVECSDPSHNFVSAIATAPSTTLPKDSTGLRRRLEDLRILVRSYVDRLPPDAVFSHRSALIVHGLPVPYIDPGDVFAESVSPHSGVRLANMLVRRRSRDFAAQEIIEGLPVTTVVQTLLDIARDYPLAFSVAVLDSAVRSSAVTVDELRSYSVSHPVRTGTRKIVNALENVDARRESVAESICAVRFVEYSVPGFEPQIEVRDENGIHLGRTDFANERAKVIAEFDGAGKYHLEGSDPQETFERERRREYALRNEGWLVFRIRWSDLFSADLFLRIGEAVRRRLIMDDRSRS
>NZ_CP050153.1|WP_167195773.1|1676179_1677493_+|UDP-N-acetylglucosamine-1-carboxyvinyltransferase
MDVFRLTGPAQLAGTIDVRGAKNSVLKLMAVSLLAVGRTTITNVPAILDVRIMVELLVRLGCEVDYDATEGIVSIDVPAEVGIQADYELVRAMRASISVLGPLTARMRAAHVALPGGDAIGSRGLDMHQAGLEALGAVVHLDHGYFVAEAPDGLRGTEIVLEFPSVGATENLVMAATLAHGTTTIANAAREPEIVDICTMLVEMGAQIEGIGTSDLTITGVESLQPVTHRTVGDRIVAGTFAFGAALSAGEVTVRGVGLDIMPNIGTKLRDSGATVEDLGEISLGDGTRGKGFRVIGAARPHAIRVATMPFPGFPTDLQPFVIALNSVSDGIGLLSENLFEARWRFVQEIARLGAKVRIDGNHALVTGSESLSGAEVEASDIRAGAGLVMAALRAGGVTEVSGIDHIERGYENFVENLRSLGVDIERVEKRDVLSFD
>NZ_CP050153.1|WP_025776910.1|1675712_1676180_+|DUF2550-family-protein
MNPSVLLIVLLSLVGLALALIVVVTIRRRSISKLSGAFDCSINVGEEYSSRPRWRLGVAVFSVTSLDWYPVFALTRRAAFRLPRADLDILVRRKPTSGEQYSVLPEAVVVDCSYGKADGRPRSVSLAMDTESLSTMASWLESSPPGFNPTMGRFT
>NZ_CP050153.1|WP_025776911.1|1675429_1675690_+|F0F1-ATP-synthase-subunit-epsilon
MATLEVNVVAADREVWAGEAKRVIARTLDGEIGILPGHEPVLGVVADGEARILTPGEDTIRVKADGGFLSVENNRVIIAADQAELL
>NZ_CP050153.1|WP_098730992.1|1673017_1673950_+|F0F1-ATP-synthase-subunit-gamma
MGAQQRVFKQKIRSTQSLRKIFKAMELIAASRIQKAIARSQAASPYANALTRAVSAVASESNVDHVLTTESDNVKRAAVLVIGPDRGFAGAYSANLLREAEELVRLLKGEGKQVELFTVGGKAKNYYTFRDRKIEKSWTGISENPTAEVAREIGEALLENFDPEAENSGVDEIYIVFTKFVSSVTHDPEYRRLLPLEVVDADEATTGGQSAGSTDASAFPLYEFEPSAEAVLDALLPRYIDSRILSALLSASASEQASRQAAMKTATDNADDLIKTYTRLANTARQAEITQELTEIVGGADALAASAAGD
>NZ_CP050153.1|WP_167195770.1|1671351_1672986_+|F0F1-ATP-synthase-subunit-alpha
MAELTIRPEEIRDALGKFVDSYNPASSEKTEVGKVVTAGDGIAHVSGLPGTMANELLRFEDGTLGLAQNLDEREIGVVILGEFSGIAEEQNVYRTGEVLSIPVGDGYLGRVVDPLGRPVDGLGDIETVGRRELELQAAGVMDRQEVREPLQTGYKSIDAMIPVGRGQRQLVIGDRKTGKTALAIDTIINQKANWETGDPKKQVRCIYVAVGQKGSTIAGVRRSLEEAGALEYTTIVSSPASDPAGFKYLAPYSGSAIGQHWMYDGKHVLIVFDDLSKQAEAYRAVSLLLRRPPGREAYPGDVFYLHSRLLERCAKLSDELGGGSMTGLPIIETKANDVGAFIPTNVISITDGQIFLQSDLFNAGQRPAVDVGVSVSRVGGAAQTKALKGVSGTLKISLAQYRSLEAFAMFASDLDDATKRDLARGARLTELLKQGQYAPMPFEKQTVSIFAGTNGYLDEIPVDDVLRFETELHDHIERKTGIFTTIRETLKLDDDTTEELKSVLAEFTQNFASSDQSGSKAGSEDTAAASSDEVEQEQIVRQKR
>NZ_CP050153.1|WP_167195767.1|1670463_1671270_+|F0F1-ATP-synthase-subunit-delta
MLQSSRLSLQAVLETANSEISGGDPRQIGEETLAVVGILVENVRLRKALADSSESAERKQQLLRTLFSTRITDAVLRISDNAVSRRWARTQDLVTSLEVAGVTAVAAAAQADGQLGQVEEEIFRFARLLESNHELSRALDSQATDESKRALVSDLLGGKAQPDTIKLVEQAALHPRGLRVAKALDQYSDILAARQQRSVADVTVARPLNEAQTERLQAALSASYGRELVLNVQVDPEVLGGVRVQVGDEMMNSTVADRLADVQRKLAG
>NZ_CP050153.1|WP_039210678.1|1669912_1670464_+|F0F1-ATP-synthase-subunit-B
MTPVNIVASAENPLLPALYDIVWSAVCLLIVFLVVWKYVLPAFNKTLDERAERIQGGIEKAEKVQAEADQALAEYQKQLADGRAEAARLRAEAQEEGAQIIADMKAQAHSEADRIIAQAQTQIDAERQSAMVQLRSEVGTLATDLASRIVGESLTDDQRSANVVDRFISDLESNSSAQPVKGA
>NZ_CP050153.1|WP_039210675.1|1669668_1669893_+|F0F1-ATP-synthase-subunit-C
MDMLAAVEGSVSTIGYGLAAIGPGVGVGIVIGKTIEGTARQPEMAGALRGNMFLGIALIEALALIGIATPFFLP
>NZ_CP050153.1|WP_062242329.1|1668840_1669587_+|F0F1-ATP-synthase-subunit-A
MAEFFPASFLFEGTPFEMNRVMLIRIIATVAVVVLLAVWAKRMKLIPTRFQSSMELAMEFVTVGIAEDTMGKEKAKKFMPLIVAIFFGILFWNVTKLIPFLNMPGTGVIGMPIVLTLVVYVTYHWAGIAEKGLGRYLKDSLILPGVPPAMHILLIPIEFITKFVTQPFTLAIRLFANMMVGHLLLVLCFSATSFFLFDAANGFQFFGIVTFAGGMFVFILEMLIVVLQAYIFALLSCVYINAAISDEH
>NZ_CP050153.1|WP_167195779.1|1679122_1679818_-|endonuclease-NucS
MRLVIAQCSVDYAGRLTAHLPMATRLIMLKSDGSVLIHSDGGSYKPLNWMTPPCTVRHIEPDAERAEAGLTELWEVSQTKTGDRLVISIAEVLSDDTYEFGVDPGLVKDGVEAHLQELLAEHIETLGEGYSLVRREYMTAIGPVDILARDDGQKSVAVEIKRRGDIDGVEQLTRYLELMNRDPLLSPVEGVFAAQEIKPQARTLAEDRGIRCVVLDYDALRGMDDPETRLF
>NZ_CP050153.1|WP_167200788.1|1679926_1680145_+|hypothetical-protein
MRTSRSLPDGTWSVQTVKGNETGKVYVCPGCGRDVTAASSHVVAWRQDAPHGIEIGVESRRHWHQRCFDRFR
>NZ_CP050153.1|WP_167195782.1|1680285_1681929_-|cell-division-protein
MTPTEEFRTAMRGYEKSEVDSRLQQLRTEVESVRKALADARSQVINADRAKLQIAGELSEAKAQLKKAANDNAEAAGPPGSRIDHLLKIAESQARETLAQANSDAETIRNKARAEAASARARMHTESNDTLSNARSEADAIISSAELRAEETIKAAEKRAAELSATTERETNQAKEANAASAKEARESLDLELSELRATAEKEAADLRAEAKTEAEETIAAAQAQADELLKSAKARDEASKKAGNDFDVELANKRKDAESERKKRYEEAQAENKKLVEEAQARAAKADTEAKEAAERAEQTRTDAVKKADEIIADGKSRAQTLISEARATAEATIEESAAEAKRNVASAQSQVDLLTKQRKTITAQLDQLRSLFAMPGVMGGDSVDPAKAESASHATEQIADGQELEDLLADDASDAAKADDSAKSSDDAKSTDGSASTGSEDAATKGGSAESTGAKSTGPAKKDASGAQDSGSAKTSAQSADGSTSTPGSKTDSGSNTGSDDDAENTAGEDLPNGATDEDTISINAQVSGSKQNNSKTSRSRNSLR
>NZ_CP050153.1|WP_167195784.1|1682160_1683351_+|acetyl-CoA-C-acetyltransferase
MADAVIVAGARTPFGRLQGELSKLSAVELGAEAISGALDRAGIQGSDVEYVIMGQVLQAGNSQGPGRQAAAKAGIPMSVPAVSVNKLCLSGINTITQAAQLIRAGEYEVVVAGGQESMSQAPHMLMKSRSGYKYGDVVAKDHMDYDGLWDAFTDQAMGGLTEEANAGDREFSRAEQDAFSARSHQRAAAAQEGGAFENEIVPVTISSRKGDVTVSADEGVRPDTTAESLSKLRPSFRKDGTITAGNASQISDGACAVVVMSREKAEELGAPILAEIRSHAWTAGPDSTLQHQPSQAIKAAAEREGVAADSFDLYEINEAFAAVGLASAKDLDIDEDKVNVNGGAVALGHPIGASGARVVLTLALELQRRGGGTGIAALCGGGGQGDSLIVSVPAQA
>NZ_CP050153.1|WP_167195787.1|1683840_1684047_+|hypothetical-protein
MNGAKLFSVATALTLVALLGFMLAGFFPIIVDFAFGIEAVAVILAMAGVVAVSFVTVRKSMENAARHY
>NZ_CP050153.1|WP_167195790.1|1684365_1686063_+|hypothetical-protein
MTESKSAVTPPVGQALNDIVKRVSETRFTLRSEDFADARTAHSTLTAELNDYVLPRINRSRTPFLIAVGGSTGAGKSTLVNSLVGRSVSPAGVRRPTTGNPVVIFNPVDAKFFESEHYLPDLPRSSDPQSSMPGVVLIADENVEAGTAILDCPDIDSISETNRALSRRVLLSADLWLFVTTANRYADAAPWALLKTAAARSTSVAIVLDRVPPEANREVRHHLSSLLSETGLANSPIFSVAELELEDGLLPHAAIYPIRSWISQVGTEGTSLERIRNRTLTGAISALPARVRELADFAEKQEQAHITLADSLEKSFRSAQSGLAEVFSDGRVLHGEVNARWQDFVGTGQLFRGLEPTMARMRDRISAAVTGKHDAATPLHVAILRSAAVSLREQAIDVVDEVNAEWRNTAAGAALIEDQPELRTVGGGLEDAVKSAVSTWSDEVNALVRDIGQGKKSKARILSFGVAGVCAVVEYAAFWDPRRTRGAGQSTQQGAGVALNLAETIFGADEAAGLISSVRQRFLDAAAGIVADCRTPFDNALRLSAVPARQAGALRASGERLEVAL
>NZ_CP050153.1|WP_167195793.1|1686059_1687640_+|ABC-transporter
MNSSAQTEIRSLAEGIRHALSLSEDKLASDVRTDAQNLLDRAEDRLGLGEDFTVVAFAGSTGSGKSSLFNAVAGLEIARVGVRRPTTSRPTACVWGEGGNDVLDWLHVPERSRTWRESALDGDDQRRLHGLILLDLPDHDSTAVEHRIESDRLVGLVDVVFWVVDPQKYADFSLHSEYLTKLAENSANMVVVLNQIDKLSPEEQKAAADHLRQLLNEDGLSETNVRISSAVTREGIPEIRSILADTVDSNDAAAERLLADMQAMAKRIRRELGEPVSSPDELAGASRLAETMSEAAGVEAVAQTVHDDYIRRAYRKTGYPVLAWAQRNAPDPLGAKHGQDRDELVRASVPATTKAQSSHVRLMAHELIAESVSTMPQAWQNEAAEAEKKSTDELSDNLDSAVTAVEITRQSPGWWSLAHTLQIVFFVASIVGLLGIIASALVAAIGSGTLPTWCWIVSFGLFVIGVIGSFVTSLVAKSARAKGAKEAAAEVDGKLRDAVGRVAQSSYLNPVKTVIGEHRQAYEMLG
>NZ_CP050153.1|WP_167195796.1|1687831_1688512_+|single-stranded-DNA-binding-protein
MSAIPITLTGTIATEPTARTLPSGRACASFRLAVNHWRVDKSTGEFVTDGTSWFGVDCYGELASNSAMSLSTGAAVIVSGSLRNREWATEERSGISPTVVAEHIGPDLRYGTAHYKRAKATDRSQSSSGQTNTESSGPSEAIWGALAPMETPSGDDVGAGEAAGLTATGPDSAAHTDSDDDRATDETGTAGRDTGVESGGSAGTDIDASGEEDPIARDTAKAAAPF
>NZ_CP050153.1|WP_167195799.1|1688611_1689355_+|hypothetical-protein
MRLVPVLGAAALTLALSGCSLFGFGADDSQPQPKQTQAKPVAEVDKVLKALKPLTGDKESVPSTKKFFSTMLDAGYEPEQLEATIDESPLGNEVPSKMFGVKTDKGCVVGEIRKGKATADLVEPTESTGSCLFGEVERPEGVKAPKGEKRDEDGDSNGAGHMPGEDINGKDGETESPAPSENGSESTSTGGSEGTAGSEGSESADSSEGTAGTSGEGTSGEASSEGGSGETSSEGDTSGEAPSLGGG
>NZ_CP050153.1|WP_167195802.1|1689463_1691146_+|energy-dependent-translational-throttle-protein-EttA
MAEFIYTMHKARKAHGDKVILDDVSMSFYPGAKIGMVGPNGAGKSTILKIMAGIEQPSNGEARLSPGYSVGILMQEPPLNEEKTVLGNVEEGVGEIKAKLDRFNAISEEMANPDADFDALMDEMGKLQEAIDAADAWDLDSQLEQAMDALRCPPPDAEVSVLSGGERRRVALCKLLLEKPDLLLLDEPTNHLDAESVLWLEQHLQSYPGAVIAITHDRYFLDHVAEWIAEVDRGHLYPYEGNYSTYLEKKQERLQVQGKKDAKLAKRLKDELEWVRSNPKAKQTKSKARLARYEEMAAEAEKTQKLDFEEIQIPAGPRLGDVVIEADKIEKGFDGRKLIDGLSFSLPRNGIVGVIGPNGVGKSTLFKTIVGMEELDGGNLKVGDTVKISYVDQSRGGIDPDKNLWEVVSDGLDFIQVGKVEMPSRAYVSAFGFKGPDQQKKAGVLSGGERNRLNLALTLKQGGNLLLLDEPTNDLDVETLGSLENALLEFPGCAVVVSHDRWFLDRVATHILAWEGTEENPANWYWFEGNFEAYEKNKVERLDEDAARPHRVTHRRLTRD

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP050153_2

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP050153_2

2079021-2079115

Orphan

Consensus_repeat	Method
CCGTAGTTGGGCTGCGAACCGTA	CRISPRCasFinder

1 spacers

The CRISPR arrays of NZ_CP050153_2

>merge|NZ_CP050153|2|2079021-2079115|CRISPRCasFinder
CCGTAGTTGGGCTGCGAACCGTACTGGGGAGCCTGCTGTCCGTATTGCTGCGAGCCGTCGTTGCCGCCCTGGCCGTAGTTCGGCTGCGAACCGTA

>NZ_CP050153|2|2|2079021-2079115|CRISPRCasFinder
CCGTAGTTGGGCTGCGAACCGTA	CTGGGGAGCCTGCTGTCCGTATTGCTGCGAGCCGTCGTTGCCGCCCTGG
CCGTAGTTCGGCTGCGAACCGTA

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP050153.1\|WP_167196655.1\|2075188_2075794_-\|HIT-domain-containing-protein	unknown	unknown	gnl\|CDD\|238606
NZ_CP050153.1\|WP_167200866.1\|2068700_2069234_-\|preprotein-translocase-subunit-YajC	unknown	unknown	gnl\|CDD\|376903
NZ_CP050153.1\|WP_167196676.1\|2084681_2085716_-\|PhoH-family-protein	unknown	unknown	gnl\|CDD\|376820
NZ_CP050153.1\|WP_039207386.1\|2071077_2071674_-\|crossover-junction-endodeoxyribonuclease-RuvC	unknown	unknown	gnl\|CDD\|234587
NZ_CP050153.1\|WP_167196649.1\|2072539_2073019_-\|NUDIX-domain-containing-protein	unknown	unknown	gnl\|CDD\|240041
NZ_CP050153.1\|WP_167196664.1\|2080765_2081776_-\|cell-division-protein-ZapE	unknown	unknown	gnl\|CDD\|224402
NZ_CP050153.1\|WP_167196670.1\|2082880_2084194_-\|HlyC/CorC-family-transporter	unknown	unknown	gnl\|CDD\|224173
NZ_CP050153.1\|WP_167196658.1\|2075790_2077797_-\|threonine--tRNA-ligase	unknown	unknown	gnl\|CDD\|237050
NZ_CP050153.1\|WP_167196667.1\|2081940_2082879_-\|GTPase-Era	unknown	unknown	gnl\|CDD\|234624
NZ_CP050153.1\|WP_139467356.1\|2071673_2072426_-\|YebC/PmpR-family-DNA-binding-transcriptional-regulator	unknown	unknown	gnl\|CDD\|234640
NZ_CP050153.1\|WP_167196679.1\|2085816_2086578_-\|16S-rRNA-(uracil(1498)-N(3))-methyltransferase	unknown	unknown	gnl\|CDD\|367950
NZ_CP050153.1\|WP_167196685.1\|2087817_2088855_-\|heat-inducible-transcriptional-repressor-HrcA	unknown	unknown	gnl\|CDD\|234621
NZ_CP050153.1\|WP_167196647.1\|2070415_2071012_-\|Holliday-junction-branch-migration-protein-RuvA	unknown	unknown	gnl\|CDD\|234645
NZ_CP050153.1\|WP_167196673.1\|2084196_2084685_-\|rRNA-maturation-RNase-YbeY	unknown	unknown	gnl\|CDD\|234575
NZ_CP050153.1\|WP_167200864.1\|2066517_2068629_-\|protein-translocase-subunit-SecD	unknown	unknown	gnl\|CDD\|235615
NZ_CP050153.1\|WP_167196652.1\|2073149_2075192_-\|S9-family-peptidase	unknown	unknown	gnl\|CDD\|224423
NZ_CP050153.1\|WP_139908139.1\|2089016_2089880_+\|DUF3097-family-protein	unknown	unknown	gnl\|CDD\|378628
NZ_CP050153.1\|WP_167196682.1\|2086574_2087690_-\|molecular-chaperone-DnaJ	unknown	unknown	gnl\|CDD\|237654
NZ_CP050153.1\|WP_167200868.1\|2069321_2070344_-\|Holliday-junction-branch-migration-DNA-helicase-RuvB	unknown	unknown	gnl\|CDD\|234619
NZ_CP050153.1\|WP_167200870.1\|2080249_2080612_+\|TIGR02611-family-protein	unknown	unknown	gnl\|CDD\|131660

Protein	Function_ID	Function_description	E-value
NZ_CP050153.1\|WP_167196655.1\|2075188_2075794_-\|HIT-domain-containing-protein	gnl\|CDD\|238606	cd01275, FHIT, FHIT (fragile histidine family): FHIT proteins, related to the HIT family carry a motif HxHxH/Qxx (x, is a hydrophobic amino acid), On the basis of sequence, substrate specificity, structure, evolution and mechanism, HIT proteins are classified into three branches: the Hint branch, which consists of adenosine 5' -monophosphoramide hydrolases, the Fhit branch, that consists of diadenosine polyphosphate hydrolases, and the GalT branch consisting of specific nucloside monophosphate transferases. Fhit plays a very important role in the development of tumours. Infact, Fhit deletions are among the earliest and most frequent genetic alterations in the development of tumours.	4.45642e-65
NZ_CP050153.1\|WP_167200866.1\|2068700_2069234_-\|preprotein-translocase-subunit-YajC	gnl\|CDD\|376903	pfam02699, YajC, Preprotein translocase subunit. See.	1.71376e-19
NZ_CP050153.1\|WP_167196676.1\|2084681_2085716_-\|PhoH-family-protein	gnl\|CDD\|376820	pfam02562, PhoH, PhoH-like protein. PhoH is a cytoplasmic protein and predicted ATPase that is induced by phosphate starvation.	1.19389e-134
NZ_CP050153.1\|WP_039207386.1\|2071077_2071674_-\|crossover-junction-endodeoxyribonuclease-RuvC	gnl\|CDD\|234587	PRK00039, ruvC, Holliday junction resolvase; Reviewed.	5.15234e-75
NZ_CP050153.1\|WP_167196649.1\|2072539_2073019_-\|NUDIX-domain-containing-protein	gnl\|CDD\|240041	cd04685, Nudix_Hydrolase_26, Members of the Nudix hydrolase superfamily catalyze the hydrolysis of NUcleoside DIphosphates linked to other moieties, X. Enzymes belonging to this superfamily requires a divalent cation, such as Mg2+ or Mn2+, for their activity and contain a highly conserved 23-residue nudix motif (GX5EX7REUXEEXGU, where U = I, L or V), which functions as a metal binding and catalytic site. Substrates of nudix hydrolases include intact and oxidatively damaged nucleoside triphosphates, dinucleoside polyphosphates, nucleotide-sugars and dinucleotide enzymes. These substrates are metabolites or cell signaling molecules that require regulation during different stages of the cell cycle or during periods of stress. In general, the role of the nudix hydrolase is to sanitize the nucleotide pools and to maintain cell viability, thereby serving as surveillance & "house-cleaning" enzymes. Substrate specificity is used to define families within the superfamily. Differences in substrate specificity are determined by the N-terminal extension or by residues in variable loop regions. Mechanistically, substrate hydrolysis occurs by a nucleophilic substitution reaction, with variation in the numbers and roles of divalent cations required.	4.79398e-37
NZ_CP050153.1\|WP_167196664.1\|2080765_2081776_-\|cell-division-protein-ZapE	gnl\|CDD\|224402	COG1485, COG1485, Predicted ATPase [General function prediction only].	3.65821e-62
NZ_CP050153.1\|WP_167196670.1\|2082880_2084194_-\|HlyC/CorC-family-transporter	gnl\|CDD\|224173	COG1253, TlyC, Hemolysins and related proteins containing CBS domains [General function prediction only].	8.15631e-88
NZ_CP050153.1\|WP_167196658.1\|2075790_2077797_-\|threonine--tRNA-ligase	gnl\|CDD\|237050	PRK12305, thrS, threonyl-tRNA synthetase; Reviewed.	0
NZ_CP050153.1\|WP_167196667.1\|2081940_2082879_-\|GTPase-Era	gnl\|CDD\|234624	PRK00089, era, GTPase Era; Reviewed.	4.2978e-163
NZ_CP050153.1\|WP_139467356.1\|2071673_2072426_-\|YebC/PmpR-family-DNA-binding-transcriptional-regulator	gnl\|CDD\|234640	PRK00110, PRK00110, YebC/PmpR family DNA-binding transcriptional regulator.	7.70653e-140
NZ_CP050153.1\|WP_167196679.1\|2085816_2086578_-\|16S-rRNA-(uracil(1498)-N(3))-methyltransferase	gnl\|CDD\|367950	pfam04452, Methyltrans_RNA, RNA methyltransferase. RNA methyltransferases modify nucleotides during ribosomal RNA maturation in a site-specific manner. The Escherichia coli member is specific for U1498 methylation.	1.54209e-57
NZ_CP050153.1\|WP_167196685.1\|2087817_2088855_-\|heat-inducible-transcriptional-repressor-HrcA	gnl\|CDD\|234621	PRK00082, hrcA, heat-inducible transcription repressor; Provisional.	4.3895e-132
NZ_CP050153.1\|WP_167196647.1\|2070415_2071012_-\|Holliday-junction-branch-migration-protein-RuvA	gnl\|CDD\|234645	PRK00116, ruvA, Holliday junction branch migration protein RuvA.	2.11197e-67
NZ_CP050153.1\|WP_167196673.1\|2084196_2084685_-\|rRNA-maturation-RNase-YbeY	gnl\|CDD\|234575	PRK00016, PRK00016, metal-binding heat shock protein; Provisional.	1.87721e-55
NZ_CP050153.1\|WP_167200864.1\|2066517_2068629_-\|protein-translocase-subunit-SecD	gnl\|CDD\|235615	PRK05812, secD, preprotein translocase subunit SecD; Reviewed.	3.44177e-114
NZ_CP050153.1\|WP_167196652.1\|2073149_2075192_-\|S9-family-peptidase	gnl\|CDD\|224423	COG1506, DAP2, Dipeptidyl aminopeptidases/acylaminoacyl-peptidases [Amino acid transport and metabolism].	2.77397e-71
NZ_CP050153.1\|WP_139908139.1\|2089016_2089880_+\|DUF3097-family-protein	gnl\|CDD\|378628	pfam11296, DUF3097, Protein of unknown function (DUF3097). This family of proteins with unknown function appears to be restricted to Actinobacteria.	2.31421e-136
NZ_CP050153.1\|WP_167196682.1\|2086574_2087690_-\|molecular-chaperone-DnaJ	gnl\|CDD\|237654	PRK14278, PRK14278, chaperone protein DnaJ; Provisional.	1.91114e-165
NZ_CP050153.1\|WP_167200868.1\|2069321_2070344_-\|Holliday-junction-branch-migration-DNA-helicase-RuvB	gnl\|CDD\|234619	PRK00080, ruvB, Holliday junction branch migration DNA helicase RuvB.	0
NZ_CP050153.1\|WP_167200870.1\|2080249_2080612_+\|TIGR02611-family-protein	gnl\|CDD\|131660	TIGR02611, Putative_membrane_protein, TIGR02611 family protein. Members of this family are Actinobacterial putative proteins of about 150 amino acids in length with three apparent transmembrane helix and an unusual motif with consensus sequence PGPGW. [Hypothetical proteins, Conserved].	4.11044e-14

>NZ_CP050153.1|WP_167196658.1|2075790_2077797_-|threonine--tRNA-ligase
MADSIDCAGESIPWKEGLTGTEIFSTDRTVVAMWLNGEPADLSRQLQSGDRIAPITIDSDAGLDILRHSTGHVTAQAVQELFPGTKLGIGPYITDGYYFDFDVAEPFTPEDLKAIQKKAAQIVKSGQTFNRVVVTEDEARARMANEPYKLELIGDKGKGTDEEASVEVGGGELTVYENVDRKGEVVWQDLCRGPHLPNTKLIGNGFAITRSSAAYWRGDQANASLQRVYGTAWASKDDLKAYQDRIAEAERRDHRKLGAEMDLFSFPEELGSGLPVFHPKGGVIKREMEDYVRARHIDEGFEYVGTPHISKETLYYTSGHLPYYGENMFPAMSVDEVRNESGEVVKEGTPYRLKAMNCPMHNLIYRSRGRSYRDLPLRLFEFGTVYRDEASGVIHGLTRVRALTQDDSHSYVAQEDAAAEIRHLLNFVLSLLRDFGLDDFYLELSTRDEDGKKADKFIGSDEQWAEATSVLEEVAQETGLELVPDPGGAAFYGPKISVQARDAIGRTWQMSTVQLDFNQPERFGLEYVAADGSRKQPVMIHSAKFGSIERFLGVLTEHYAGAFPVWLAPVQVTCIPVADEFNDYLAEVADQLRKAGVRVEIDDSDDRFPKKIRNASKSKVPFTLIAGGEDRDAGAVSFRFRSGEQENGVPVAEAVRRILDSIETKAQV
>NZ_CP050153.1|WP_167196655.1|2075188_2075794_-|HIT-domain-containing-protein
MSGGDDDRSAQENPDGRLGEGIPHPEAAAGFPGEPDGFQRLWTPHRMVYIDGQDKPKGDQPEECPFCAALSKSDEDGLIVARGQAVYAVLNLYPYNPGHLLICPYRHVADYTDLTGEETVELAEFTQKAMRVIRAVSGPHGFNLGMNQGPVAGAGIAAHLHQHVVPRWGGDANFLPVIAQTKALPQVHADVQARLKKEWNR
>NZ_CP050153.1|WP_167196652.1|2073149_2075192_-|S9-family-peptidase
MNPEDLGTLAEYSSPVLRGHDTVITIRRPDLESNSYLSQLFSLTEDTSRRLTHSWSDSTPQCGPNWSGYLSAEKKAAPQLYVGDSLETAHQITDNHLGVAEFALDDSRSRALYVARVAEPGRYGLDESIPATEEAPRRITTASYLANGLGYTNDRPARAFLVDLAEPGLGTVGLRGASEVPLSTLLTTPDSDVHDPQFSPDGHWASVIAAVEPDRGRPDLRSTVWLLGREESRPLDLPPMSVSLHVWIDADRVLLLGNALTRDELDFVGQMPGLFIHTVSTGSTRRLTDPETVALAPIPPQIRGGAVVAAVDTDGATRIVRIGLDAAEVGIDDLEFLTDDTTVVNGFDADNETLVFTGSTPHSPAVLGRIALGGPTASGAATEMGSSVIVKEHPAPANSVLPQVLRVPGDSGTITGWLAKPHGEGPFPVILNIHGGPFAQYTHSWFDETQVLTSAGYAVVFSNPRGSGGRTRSWGTAVQGDMAKPAMADVLAVLDHALESDPSLDRSRLGIQGGSYGGYLTAMTIAADHRFRAAIVERGYLDPDSFVGTSDIGRFFTEEYTSRSREAITRQSPLAHAPQVGTPTLVMHSELDLRCPLEQAQQYYAALQRVGVDTEMLIFPGENHELSRAGQPRHRRQRFEAILDWWDRRLSGGNRTPPAEERHIPEAADPEAASASDTAS
>NZ_CP050153.1|WP_167196649.1|2072539_2073019_-|NUDIX-domain-containing-protein
MKPRKASRVVLLNERDEVLLIRAQDLLTPSHQWWMTCGGGSELGESAAQTAARELAEETGIECEPHELIGPLATRDEVFEFTEKSLRQVETYFAFRTSEDIELEDAVWTDIEKRSLLEFRWWTREELLTTTETIYPKNLLGLIDLATAGSVPEVPLVID
>NZ_CP050153.1|WP_139467356.1|2071673_2072426_-|YebC/PmpR-family-DNA-binding-transcriptional-regulator
MSGHSKWATTKHKKAAIDAKRGKLFAKLIKNIEVAARNGGPDPDGNPTLFDAIQKAKKNSVPADNITRAVKRGGGLDGSGVNYETIMYEGYAAGGVALLIECLTDNRNRAASEVRVAVTRNGGSMADPGSVTYNFNRKGVITVGAEETDEEAILLATMDAGAEEVKEVGEKFEIICEATDLVAVRTALVDAGIDYDSAEASFVPELEVSLDAETASKVFSLIDALEDSDEVQNVYSNADVSDEVLAELDA
>NZ_CP050153.1|WP_039207386.1|2071077_2071674_-|crossover-junction-endodeoxyribonuclease-RuvC
MRILGVDPGLTRCGLGVIDTLPARKAKMVAVDVLRTPSADSVDLRLGAIAEAFDTWLDTYRPDVVAIERVFARNDVSTIMGTAQASGLTMGLAARRGLPVAMHTPSEVKAAITGSGRADKKQVTSMVTRILGLDAPPKPADAADALAIAICHSWRGALSAQSTPGKNKDLTERKAGGRQGSGLTKAQQQWAEAMRRAR
>NZ_CP050153.1|WP_167196647.1|2070415_2071012_-|Holliday-junction-branch-migration-protein-RuvA
MISFLSGTVHRIAADHLVVLTYGVGRKVHVTPDTLAGTRHGAEIELVTSLVVREDSMTLYGFGTEDENHTFEVLLSISGIGPRLAMAILSVMGPDELAAAITNQDANALTRVPGIGKKGASRIILELENKLPKLTAAAPGPTLSFGGGNQQVVDALVGLGWKEAQAEDVVAEVVKETGADAGTSVVLKAALKVLGAKK
>NZ_CP050153.1|WP_167200868.1|2069321_2070344_-|Holliday-junction-branch-migration-DNA-helicase-RuvB
MTGAERERLVSGRAETAERDDEAALRPKGLADFIGQPKVREQLSLVLDAAKARQKAPDHVLLSGPPGLGKTTLAMIVAHEMNSSLRVTSGPAVQHAGDLAAILSSLEEGEVLFIDEIHRMARAAEEMLYVAMEDFRVDVIVGKGPGATAIPLDLPQFTLVGATTRSGLLPAPLRDRFGFTALLDFYSSADLLTVLQRSARMLGIDSELAGLEEISTRSRGTPRIANRLLRRVRDWAQVRGSGIIDEEAATNALRVYEVDELGLDRLDRSVLQVLCKRFGGGPVGLGTLAVSVGEEADTVETVSEPYLVREGLISRTPRGRVATTAAWDHLKMQIPANYEF
>NZ_CP050153.1|WP_167200866.1|2068700_2069234_-|preprotein-translocase-subunit-YajC
MLIPLALAALLIFFLFNSRRKQKARAEEIKSGLVPGAKVMTTFGVFGTVLSIDEESNQVTIESGPGTVLRVHRQAIGQIENNQAAAPVDAPGAAAPAADADADAADDEKPAITDAELDAMNERKRAEKDTTDEDTAEDVVADESAAKTEDADAAAETDADSAAADEDSTDSDTDKKN
>NZ_CP050153.1|WP_167200864.1|2066517_2068629_-|protein-translocase-subunit-SecD
MRFLWLTIITLVLAAIIAGGVIWSNATTTPKLALDLEGGTSIILEPQVSEGTDISKEQLDQAVAIIRQRVDSTGVSEAEITTQGDRNIVVNLPGNPDEETRNLVRSSAQLVFRRVALVGDPRSQEQIQKEQEKSGGEESGGDDGLSDEERKRLEDLTGADSQGDDQGEEQAPSGGGDVVKAGGTAEKKTDESSEATKSSESERKDAEKSGEGSGSSEGSKVTDSTPRPLFDPEKDAAEWQTDKIIKQYSELDCTNKKNRTGGQQKPSDEPVVSCSEDGQAKYILGPVELSGDHLADANAGYAAGANGVQTNNPAVNLSFDATGREIFKQITSDITGKQQPYNQFAIELDGLVLSAPSSNAVITDGNAQITGDFSLDEAQTLANQLKNGSLPLSFQVQSEDQISPTLGSNYLKIGLLTGLVGLLLVVVYSLLQYRVLGLVTVSSLVVAGVLTYLLLLLASWRYGYRLSLAGVAGIIIGIGMAADSFIVYFERVRDELRSGRNLLSAVEVGWDRAKRTIYASKAVNMLAAVILYILAVGSVRGFAFTLGLTVIIDVLIVFLFTHPMLQLLSRTKFFGEGHPMSGMDPRLLGVKPAAYRGALNLSIDDKDKTPEAKRREKARMRKAGMTPEDGSETPNAATTGSESEETSTTKNTKAAKSKSAKAAKTATAAGGMTIAERKAAARRAEDDDADDDSATDDGKEADK
>NZ_CP050153.1|WP_167200870.1|2080249_2080612_+|TIGR02611-family-protein
MLANAHTAAIYRSIVGGLGTIIVLVGLALVPLPGPGWLIVIIGLFIISSEFRWAQRLLHFVRVNVERWTQWIMAQPLWVRWTVGAVTAAFVGIIVWLTLRLTGLPDWVPDLRVFDLIGLR
>NZ_CP050153.1|WP_167196664.1|2080765_2081776_-|cell-division-protein-ZapE
MNAEQTLVALSDRSPQVAPEELIAGLVPPPQFEDVSFDSYRTDPAEPSQEEARNKLREFTERSTSQGFFGKLFSKGKSGGAKGVYLDGGYGVGKTHLLASAWHANEKPATFGTFVEYTNLVGALGFARARDDLSKMKLVCVDEFELDDPGDTVLMSRLMRELTDAGVKIIATSNTLPGSLGEGRFAAQDFLREIQALADQFEVYRIDGKDYRARELTAPADPLPESELDSAASQLDGVVARDDFSQLLSHLSTVHPSRYGRMVDGIDAAVWENVRTIDNESVALRFVALVDRLYDRNVHIINSGAALDKVFTEESLAGGYKKKYMRCLSRLTALSS
>NZ_CP050153.1|WP_167196667.1|2081940_2082879_-|GTPase-Era
MEFRTDYPEDYRAGFACFVGRPNTGKSTLTNALVGEKVAITSAKPQTTRHTIRGIVHKDDHQLILIDTPGLHKPRTLLGSRLNDLVASTLGEVDVIGFCLPADEPIGPGDRYIASQLALLDGRTPIVALVTKVDRVPKDKIAEALLAVGELADFADVVPVSAVEDFQVDTVDSVLAAHLPKSPPLYPDGDLTDEPEEKMIAELVREAALEGVRDELPHSLAVQVEEMYPREGRSEENPLWNVHVNLYVERPSQKAIIIGKGGSRLKAIGSESRQGIERLLGTKVYLDLHVKVAKDWQRDPKQLGRLGFDFNN
>NZ_CP050153.1|WP_167196670.1|2082880_2084194_-|HlyC/CorC-family-transporter
MFMFFLGAALCLIIAATLSAVDAALLNVSHHAVEEAKEDGKRSAVRVERILADLPTNINVIIFVRNFLEALATVFIALAYDSYYSVGPLMVFLTVITASVSVFIIAGVSPRTIGKRRSLAVSLNLSWVVRIVLVALKPLTRILVVLGNLLTPDKVYKDGPFVTSEQLRDLVERASESDVIEDGEREMIQSVFNLSDTSANEVMVPRTDLITVDADVSLQKTMNLFFRSGFSRIPVCGEDLDDVRGVAYLKDVARRLHLHPEEAERPVGNLARTVLFVPETKPADDLLRQMQLDSTHLAILVDEYGGTAGLVTIEDIVEEIVGEIEDEYDNGDDELVAADDGSFIISTRMSISDFAEYFDVRIDEDDVNSVGGLLSKLIDRVPIDGSHAEIEGLEIEAMEGQGRRHRITHVRVTRTHEDSRDDAQTAAAGGSGTKEED
>NZ_CP050153.1|WP_167196673.1|2084196_2084685_-|rRNA-maturation-RNase-YbeY
MNTEILNETDAEVDLDEVVALTEYLGDALHMHPGAELAVTMVDSAAMSELHVTWMDLEGPTDVMSFPMDQLHRGEPDKPTEGQMGDIIICPEVAEAQARAAGHSAMDEILLLTVHGFLHLLGYDHGEPEAREEMFALQRHLLLTFFAARYDGRTDIPTPTEV
>NZ_CP050153.1|WP_167196676.1|2084681_2085716_-|PhoH-family-protein
MNPTDSDTAAPGDGAADKDAVTDTRGAERDTVRLVIPDSIDLVAFFGPGEKNLRALEKTFDDLDIHVRANQVQVTGDPKRVEAFVSVIGELKKLHTAGHRINEETIDRVTTFSSEGAAASAVLGTNILSTRGKSIRPKTMGQHDYVKAIRNHTITFGIGPAGTGKTYLAMAMAVNALQHKEVSRIILTRPAVEAGESLGYLPGTLNDKIDPYVRPLYDALHDMVDPESIPLLIETGTIEVAPLAYMRGRTLNDAFIILDEAQNTTAEQMKMFLTRLGFGSRMVVTGDISQIDLPGKTRSGLKVVRDILDGIDDLQFCELGSKDVVRHSLVTKIVEAYDLWGNAE
>NZ_CP050153.1|WP_167196679.1|2085816_2086578_-|16S-rRNA-(uracil(1498)-N(3))-methyltransferase
MSLPVFRSATAAEAVVGSALTLGEDVAGHAVRVRRIGPGEVIDIVDGEGTRVRGTVTAASASEVTIDVTAVTNEDSTGPRLVLVQALAKGDRDLQAIETATEIGVDEVIPWAAERSIADWPAKKREKMAAKWENLLNAASLQARRSRFPVLRELVRGASLAKSLDETDAVFVLHETAERRLSEALAALTADESSPLPERIVFVVGPEGGISDRELDALSACGATPVLLGPTILRSSSAGPAGLVLAQNSLGRW
>NZ_CP050153.1|WP_167196682.1|2086574_2087690_-|molecular-chaperone-DnaJ
MADHYETLGVSKDASAAEIKSSYRKLARKYHPDVNPGHEDEFKAISLAYDVLSDPEKRRNYDMGGGENGQGFPAGGGFGGFGDIFETFFGGGGGQAGGPIPRTQRGKDALVGVNIDLKTAAFGGTVDLDVTTAVVCDTCSGAGTQEGTKIETCSLCHGAGSVQRMTRTLLGQMVTNQTCNSCHGFGTVIPNPCLNCQGDGRVRKQRTMKIRIPAGVSDGTRIQLSSQGEVGPGGGPAGDLFVEVMVTRHEVFQRDGDNLRAAVSVPMTAATLGATIPFETFDGTQDLTIAAGIQSGTVVKLPGLGATRLRSETRGDMLITVDVLTPDKLDDEQRELLEKLAELRGEETPRAQISTENRGMFSRMRERFAGR
>NZ_CP050153.1|WP_167196685.1|2087817_2088855_-|heat-inducible-transcriptional-repressor-HrcA
MNDSRRAQVLRAIVEDFVATNEPVGSKAIVQRHTLGVSPATIRNDMAQLEQEGYIAQPHTSAGRIPTDLGYRMFVDRIDEFKPLTTAERRAIFQLIDGDVDLDEMLDRTVRVLSGLTRQVALIQYPTVSRARIKHIEIVGLGPGRILVVLITDAGQVEQKSVIAPSPLDEDAVRGLRDQINAEFAGRTLAQVFGSSPAEAAAPEPTEPSSRDDSGLTQVRAAVVDLVAATREERIIMAGTANLARSGSEFGEKMAPILEAFEEQVVLLKLLTSMAEDHEGISVRIGRENTHESFSSTSVVAAEYGHDAGSSARLAVLGPTRMDYPTTISAVRAVAKYVSSILDRG
>NZ_CP050153.1|WP_139908139.1|2089016_2089880_+|DUF3097-family-protein
MPVNAFDRYGPDVLSGSSPSSHRPKKSRQVELGLGMVLEDAMSGYVGAVVGAEKTTAGVVVKLEDRVGKVRAFPLGPGFLLEGQPVDVQLPKKKAQQPGRTASGSRAVVGAKARVARGSRIWVEGKHDAELVEKIWGDDLRIEGVVVEPLGGLDDVADKLEAFGPDRDHRVGVLADHLVSGTKESKIAEAVRADPRYRDVVHIIGHPYVDIWQAVKPHVVGIREWPVVPRGEDWKTGILRRIGWPHADHRDVARGWVRILGKVSTIADVEPTLSGRVEELIDFVTVG

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Crispr_ID: NZ_CP050153_3

CRISPR_ID

CRISPR_location

CRISPR_type

Repeat_type

Spacer_info

Cas_protein_info

CRISPR-Cas_info

NZ_CP050153_3

3087122-3087235

Orphan

Consensus_repeat	Method
CTCCTCCTCGTAGTCCTCTGCGGG	CRISPRCasFinder

2 spacers

The CRISPR arrays of NZ_CP050153_3

>merge|NZ_CP050153|3|3087122-3087235|CRISPRCasFinder
CTCCTCCTCGTAGTCCTCTGCGGGCTCCGCGTCGCCTGCCTCGGCCGGTTCCTCCTCCTCGTAGTCCTCTACGGGTTCCTCCTCATACTCCTCTTCGGCTTCGCCCTCCGCGGG

>NZ_CP050153|3|3|3087122-3087235|CRISPRCasFinder
CTCCTCCTCGTAGTCCTCTGCGGG	CTCCGCGTCGCCTGCCTCGGCCGGTTC
CTCCTCCTCGTAGTCCTCTACGGG	TTCCTCCTCATACTC
CTCTTCGGCTTCGCCCTCCGCGGG

Protein	Signature genes	Signature genes Name	Protein_function
NZ_CP050153.1\|WP_039206887.1\|3085577_3085829_-\|gas-vesicle-protein	unknown	unknown	gnl\|CDD\|310007
NZ_CP050153.1\|WP_167198817.1\|3096487_3096949_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|378584
NZ_CP050153.1\|WP_167198771.1\|3078508_3080662_+\|catalase	unknown	unknown	gnl\|CDD\|236886
NZ_CP050153.1\|WP_167198808.1\|3092902_3094084_-\|NAD(P)/FAD-dependent-oxidoreductase	unknown	unknown	gnl\|CDD\|223523
NZ_CP050153.1\|WP_167201066.1\|3083581_3084562_-\|gas-vesicle-protein	unknown	unknown	gnl\|CDD\|376379
NZ_CP050153.1\|WP_167198777.1\|3082416_3083265_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|377652
NZ_CP050153.1\|WP_167198811.1\|3094150_3094951_-\|SDR-family-oxidoreductase	unknown	unknown	gnl\|CDD\|212491
NZ_CP050153.1\|WP_152347519.1\|3090557_3090866_+\|hypothetical-protein	unknown	unknown	unknown
NZ_CP050153.1\|WP_167198789.1\|3085837_3086590_-\|GvpL/GvpF-family-gas-vesicle-protein	unknown	unknown	gnl\|CDD\|377652
NZ_CP050153.1\|WP_167198780.1\|3083261_3083585_-\|gas-vesicle-protein-K	unknown	unknown	gnl\|CDD\|377462
NZ_CP050153.1\|WP_167198792.1\|3086586_3087021_-\|gas-vesicle-structural-protein-GvpA	unknown	unknown	gnl\|CDD\|236485
NZ_CP050153.1\|WP_167201068.1\|3096945_3097419_-\|hypothetical-protein	unknown	unknown	unknown
NZ_CP050153.1\|WP_167198798.1\|3088145_3088826_-\|hypothetical-protein	unknown	unknown	gnl\|CDD\|235640
NZ_CP050153.1\|WP_167198801.1\|3089098_3090238_-\|YbdK-family-carboxylate-amine-ligase	unknown	unknown	gnl\|CDD\|237408
NZ_CP050153.1\|WP_167198786.1\|3085086_3085581_-\|gas-vesicle-protein	unknown	unknown	gnl\|CDD\|368618
NZ_CP050153.1\|WP_167198805.1\|3090860_3092702_-\|MFS-transporter	unknown	unknown	gnl\|CDD\|340874
NZ_CP050153.1\|WP_167198783.1\|3084587_3085064_-\|gas-vesicle-protein	unknown	unknown	gnl\|CDD\|376379
NZ_CP050153.1\|WP_167198814.1\|3094993_3096367_-\|NAD-dependent-succinate-semialdehyde-dehydrogenase	unknown	unknown	gnl\|CDD\|143418
NZ_CP050153.1\|WP_167198774.1\|3080782_3082420_-\|NAD-dependent-epimerase/dehydratase-family-protein	unknown	unknown	gnl\|CDD\|187551
NZ_CP050153.1\|WP_167198820.1\|3097755_3098115_-\|hypothetical-protein	unknown	unknown	unknown

Protein	Function_ID	Function_description	E-value
NZ_CP050153.1\|WP_039206887.1\|3085577_3085829_-\|gas-vesicle-protein	gnl\|CDD\|310007	pfam05120, GvpG, Gas vesicle protein G. These proteins are involved in the formation of gas vesicles.	7.52599e-09
NZ_CP050153.1\|WP_167198817.1\|3096487_3096949_-\|hypothetical-protein	gnl\|CDD\|378584	pfam11181, YflT, Heat induced stress protein YflT. YflT is a heat induced protein.	4.77269e-12
NZ_CP050153.1\|WP_167198771.1\|3078508_3080662_+\|catalase	gnl\|CDD\|236886	PRK11249, katE, hydroperoxidase II; Provisional.	0
NZ_CP050153.1\|WP_167198808.1\|3092902_3094084_-\|NAD(P)/FAD-dependent-oxidoreductase	gnl\|CDD\|223523	COG0446, HcaD, Uncharacterized NAD(FAD)-dependent dehydrogenases [General function prediction only].	2.65201e-53
NZ_CP050153.1\|WP_167201066.1\|3083581_3084562_-\|gas-vesicle-protein	gnl\|CDD\|376379	pfam00741, Gas_vesicle, Gas vesicle protein.	4.21582e-09
NZ_CP050153.1\|WP_167198777.1\|3082416_3083265_-\|hypothetical-protein	gnl\|CDD\|377652	pfam06386, GvpL_GvpF, Gas vesicle synthesis protein GvpL/GvpF. This family consists of several bacterial and archaeal gas vesicle synthesis protein (GvpL/GvpF) sequences. The exact function of this family is unknown.	5.88415e-39
NZ_CP050153.1\|WP_167198811.1\|3094150_3094951_-\|SDR-family-oxidoreductase	gnl\|CDD\|212491	cd05233, SDR_c, classical (c) SDRs. SDRs are a functionally diverse family of oxidoreductases that have a single domain with a structurally conserved Rossmann fold (alpha/beta folding pattern with a central beta-sheet), an NAD(P)(H)-binding region, and a structurally diverse C-terminal region. Classical SDRs are typically about 250 residues long, while extended SDRs are approximately 350 residues. Sequence identity between different SDR enzymes are typically in the 15-30% range, but the enzymes share the Rossmann fold NAD-binding motif and characteristic NAD-binding and catalytic sequence patterns. These enzymes catalyze a wide range of activities including the metabolism of steroids, cofactors, carbohydrates, lipids, aromatic compounds, and amino acids, and act in redox sensing. Classical SDRs have an TGXXX[AG]XG cofactor binding motif and a YXXXK active site motif, with the Tyr residue of the active site motif serving as a critical catalytic residue (Tyr-151, human prostaglandin dehydrogenase (PGDH) numbering). In addition to the Tyr and Lys, there is often an upstream Ser (Ser-138, PGDH numbering) and/or an Asn (Asn-107, PGDH numbering) contributing to the active site; while substrate binding is in the C-terminal region, which determines specificity. The standard reaction mechanism is a 4-pro-S hydride transfer and proton relay involving the conserved Tyr and Lys, a water molecule stabilized by Asn, and nicotinamide. Extended SDRs have additional elements in the C-terminal region, and typically have a TGXXGXXG cofactor binding motif. Complex (multidomain) SDRs such as ketoreductase domains of fatty acid synthase have a GGXGXXG NAD(P)-binding motif and an altered active site motif (YXXXN). Fungal type ketoacyl reductases have a TGXXXGX(1-2)G NAD(P)-binding motif. Some atypical SDRs have lost catalytic activity and/or have an unusual NAD(P)-binding motif and missing or unusual active site residues. Reactions catalyzed within the SDR family include isomerization, decarboxylation, epimerization, C=N bond reduction, dehydratase activity, dehalogenation, Enoyl-CoA reduction, and carbonyl-alcohol oxidoreduction.	3.18754e-68
NZ_CP050153.1\|WP_167198789.1\|3085837_3086590_-\|GvpL/GvpF-family-gas-vesicle-protein	gnl\|CDD\|377652	pfam06386, GvpL_GvpF, Gas vesicle synthesis protein GvpL/GvpF. This family consists of several bacterial and archaeal gas vesicle synthesis protein (GvpL/GvpF) sequences. The exact function of this family is unknown.	1.11407e-53
NZ_CP050153.1\|WP_167198780.1\|3083261_3083585_-\|gas-vesicle-protein-K	gnl\|CDD\|377462	pfam05121, GvpK, Gas vesicle protein K. These proteins are involved in the formation of gas vesicles.	3.51464e-19
NZ_CP050153.1\|WP_167198792.1\|3086586_3087021_-\|gas-vesicle-structural-protein-GvpA	gnl\|CDD\|236485	PRK09368, PRK09368, gas vesicle structural protein GvpA.	5.53272e-46
NZ_CP050153.1\|WP_167198798.1\|3088145_3088826_-\|hypothetical-protein	gnl\|CDD\|235640	PRK05901, PRK05901, RNA polymerase sigma factor; Provisional.	4.77275e-05
NZ_CP050153.1\|WP_167198801.1\|3089098_3090238_-\|YbdK-family-carboxylate-amine-ligase	gnl\|CDD\|237408	PRK13517, PRK13517, glutamate--cysteine ligase.	2.91746e-87
NZ_CP050153.1\|WP_167198786.1\|3085086_3085581_-\|gas-vesicle-protein	gnl\|CDD\|368618	pfam05800, GvpO, Gas vesicle synthesis protein GvpO. This family consists of archaeal GvpO proteins which are required for gas vesicle synthesis. The family also contains two related sequences from Streptomyces coelicolor.	5.65422e-23
NZ_CP050153.1\|WP_167198805.1\|3090860_3092702_-\|MFS-transporter	gnl\|CDD\|340874	cd17316, MFS_SV2_like, Metazoan Synaptic vesicle glycoprotein 2 (SV2) and related small molecule transporters of the Major Facilitator Superfamily. This family is composed of metazoan synaptic vesicle glycoprotein 2 (SV2) and related small molecule transporters including those that transport inorganic phosphate (Pht), aromatic compounds (PcaK and related proteins), proline/betaine (ProP), alpha-ketoglutarate (KgtP), citrate (CitA), shikimate (ShiA), and cis,cis-muconate (MucK), among others. SV2 is a transporter-like protein that serves as the receptor for botulinum neurotoxin A (BoNT/A), one of seven neurotoxins produced by the bacterium Clostridium botulinum. BoNT/A blocks neurotransmitter release by cleaving synaptosome-associated protein of 25 kD (SNAP-25) within presynaptic nerve terminals. Also included in this family is synaptic vesicle 2 (SV2)-related protein (SVOP) and similar proteins. SVOP is a transporter-like nucleotide binding protein that localizes to neurotransmitter-containing vesicles. The SV2-like family belongs to the Major Facilitator Superfamily (MFS) of membrane transport proteins, which are thought to function through a single substrate binding site, alternating-access mechanism involving a rocker-switch type of movement.	1.4425e-49
NZ_CP050153.1\|WP_167198783.1\|3084587_3085064_-\|gas-vesicle-protein	gnl\|CDD\|376379	pfam00741, Gas_vesicle, Gas vesicle protein.	8.22961e-15
NZ_CP050153.1\|WP_167198814.1\|3094993_3096367_-\|NAD-dependent-succinate-semialdehyde-dehydrogenase	gnl\|CDD\|143418	cd07100, ALDH_SSADH1_GabD1, Mycobacterium tuberculosis succinate-semialdehyde dehydrogenase 1-like. Succinate-semialdehyde dehydrogenase 1 (SSADH1, GabD1, EC=1.2.1.16) catalyzes the NADP(+)-dependent oxidation of succinate semialdehyde (SSA) to succinate. SSADH activity in Mycobacterium tuberculosis (Mtb) is encoded by both gabD1 (Rv0234c) and gabD2 (Rv1731). The Mtb GabD1 SSADH1 reportedly is an enzyme of the gamma-aminobutyrate shunt, which forms a functional link between two TCA half-cycles by converting alpha-ketoglutarate to succinate.	0
NZ_CP050153.1\|WP_167198774.1\|3080782_3082420_-\|NAD-dependent-epimerase/dehydratase-family-protein	gnl\|CDD\|187551	cd05240, UDP_G4E_3_SDR_e, UDP-glucose 4 epimerase (G4E), subgroup 3, extended (e) SDRs. Members of this bacterial subgroup are identified as possible sugar epimerases, such as UDP-glucose 4 epimerase. However, while the NAD(P)-binding motif is fairly well conserved, not all members retain the canonical active site tetrad of the extended SDRs. UDP-glucose 4 epimerase (aka UDP-galactose-4-epimerase), is a homodimeric extended SDR. It catalyzes the NAD-dependent conversion of UDP-galactose to UDP-glucose, the final step in Leloir galactose synthesis. Extended SDRs are distinct from classical SDRs. In addition to the Rossmann fold (alpha/beta folding pattern with a central beta-sheet) core region typical of all SDRs, extended SDRs have a less conserved C-terminal extension of approximately 100 amino acids. Extended SDRs are a diverse collection of proteins, and include isomerases, epimerases, oxidoreductases, and lyases; they typically have a TGXXGXXG cofactor binding motif. SDRs are a functionally diverse family of oxidoreductases that have a single domain with a structurally conserved Rossmann fold, an NAD(P)(H)-binding region, and a structurally diverse C-terminal region. Sequence identity between different SDR enzymes is typically in the 15-30% range; they catalyze a wide range of activities including the metabolism of steroids, cofactors, carbohydrates, lipids, aromatic compounds, and amino acids, and act in redox sensing. Classical SDRs have an TGXXX[AG]XG cofactor binding motif and a YXXXK active site motif, with the Tyr residue of the active site motif serving as a critical catalytic residue (Tyr-151, human 15-hydroxyprostaglandin dehydrogenase numbering). In addition to the Tyr and Lys, there is often an upstream Ser and/or an Asn, contributing to the active site; while substrate binding is in the C-terminal region, which determines specificity. The standard reaction mechanism is a 4-pro-S hydride transfer and proton relay involving the conserved Tyr and Lys, a water molecule stabilized by Asn, and nicotinamide. Atypical SDRs generally lack the catalytic residues characteristic of the SDRs, and their glycine-rich NAD(P)-binding motif is often different from the forms normally seen in classical or extended SDRs. Complex (multidomain) SDRs such as ketoreductase domains of fatty acid synthase have a GGXGXXG NAD(P)-binding motif and an altered active site motif (YXXXN). Fungal type ketoacyl reductases have a TGXXXGX(1-2)G NAD(P)-binding motif.	1.27807e-58

>NZ_CP050153.1|WP_167198792.1|3086586_3087021_-|gas-vesicle-structural-protein-GvpA
MSTSTVERSRGSYVDRPSSSSLADVIEIILDKGLVIDAYVRVSLVGIEVLTIDARIVIASVDTYLRFAEATNRLDLTQQGGRDLPEMMGGMMENGSKGKTQGAVEGIKDALTSDDSDDDSGESSSQEKSRRRTKRPARNSSESE
>NZ_CP050153.1|WP_167198789.1|3085837_3086590_-|GvpL/GvpF-family-gas-vesicle-protein
MSEEGAPLADRYLYGIVRAGAELPTGPDGVQGNALALVESGAVAAVVTELADSGMLGTPEALQNHSVVLDELAEKQPVLPLAFGTVVPGGADIAEQVLAPQADVFAEALDQLAGCTQFTLRISFDRDAILREIVSGNPEVAELRERISGTSEDETRNERIRLGEIVVTTMESWRRTEAPPILEQIRSATVETAMREVGQAEDVAEVAVLVRRDAIDEFDSVIEELAEANRERMRFRLIGPQAPYDFVPEM
>NZ_CP050153.1|WP_039206887.1|3085577_3085829_-|gas-vesicle-protein
MGLLSAVFGAPLAPLKGTVWVAEQVRGEAEKRYFDPGAIRRQLEEVAGARERGSISDDEADALERELVGRLLEGRRRRTEEDR
>NZ_CP050153.1|WP_167198786.1|3085086_3085581_-|gas-vesicle-protein
MSEESTANEESRAEGSSADDGGTTTKRARKPVEKERTSGGTSRRSSSSASSSREKATSSSSEKAKSSSRSESRSHSATGQRISAVSAVKRAIEQFSTLTGRPPESVVGTRWKDDRWSVRLEVVESRRIPDSADLLAEYEVELDADGELMAYDRKDRYVRGRPSE
>NZ_CP050153.1|WP_167198783.1|3084587_3085064_-|gas-vesicle-protein
MNQPNDAMQPQRSQEGTLLHVVETLLDKGLVLNADIMVSVAGVELLGIRIRAALASFETAARYGLDFPAGTDRETVAWKEAVEQKDTCPECGKRSALAQLMNDYCPWCGWQSARSKRIEAGEPAQLNSADDADTSAEQAAGSSADAGTPAAGSPGDDR
>NZ_CP050153.1|WP_167201066.1|3083581_3084562_-|gas-vesicle-protein
MQPTRDPRATLPDLIEVLLNKGVHLNLDLIISVSDIPLIGINLRATIAGIETMIEYGMMQQWDRDTREWVQRAVRTHLPLAADEEILAKMAGGHYQDNFYRTWRPGSAYLTTQRLIIHRRDPAETLWQTRLDAIASVSALREPSIGGEERTRILVGLNDGTEAILSALEPDRLISLVQARLDRTDGAPSSTPEATTAEDRPLREGRMWFLETLSSGSTWRGGQAQLSNTELTWRSPMDGRARVRIPPEQLLDIRREERSNPTDERRVLILETADSTITLAADDAGAWFAGLDEWRTGPGDRRSAPLEATMSPGRNPDERAEEGAAS
>NZ_CP050153.1|WP_167198780.1|3083261_3083585_-|gas-vesicle-protein-K
MTLNVNEESLKHGVLTLVVTLVEVIQEALETQAVRRMEGGDLTEDEQNRLGEALLELDEAMDQIKDQHGITGSVDDLHRGLDDVVDEVVDKLINPARWAEENGKGVE
>NZ_CP050153.1|WP_167198777.1|3082416_3083265_-|hypothetical-protein
MNAEGDMLYVYAIVAGDDYAPAVTGIDGSALHMVGRDTGPRAVVHRHTRGPFDGPDDSVRRWVLEHSEVIDDAWQNSPALLPVSFNVIVRSDPETEATATQQLEHWLDDSAVMLSRRLEELCDTSELRVEIFLDGGLLEEVDAEVGEMRTEMESRPAGVRRLLEKRLEKTEKEIVDRAADRIYPEIRARIAAHCLDIEEHRSTSRESGLTPVIMASCLVRSTDATALGAELTALKKAQPALSIRFLGPWPPYSFADVSISEERNPSSSAPDSPTPNPQGETT
>NZ_CP050153.1|WP_167198774.1|3080782_3082420_-|NAD-dependent-epimerase/dehydratase-family-protein
MRVAVIGATGNVGTAVLDVLGRTPEITSVLGISRRMPDTEAEPYSGCEWRSIDIAAASSEGTAHRDLTEALTGADAVIHLAWLIQPNSDRDLLRRVNVDGTARVAAAVAAAGVPHLVVASSVGAYSPDDSMDKRDEEWPTEGIRSSHYSVDKAAQERVLDDFCADHPEITVTRLRPALIFGAPAASEIQRYFLGTWMPVQLLRAGRLPFLPLPAGLRGVQAVHSTDVARAYVASVLRRRSGAFNICADDVLHPKDLAELLDHGRHIPVPNGAVRAALGMGHSSSLVAADAGWLDMGLHVPLMDNGRARRELGWEPEYSAMDAARELLKGMADGEGAASVPLRPRDVEHTRLRATDDTSRGHDAPGADEHVDMDLLGLYLSDHLTGATAGAERIERMAADFIDTPVFAALSELAAEIRGEHLYVRHLIGELGFRRRPLAEAVSWVGERVGRLKSNGSLLKRSPMTLVLEAELMRSAVIGKLGMWQTLEGNAEALGLDAEQFRGFAQKAEHQREVLDTVHSYARSRAFRRYRAVYDQASGVSPVRGD
>NZ_CP050153.1|WP_167198771.1|3078508_3080662_+|catalase
MSTEDRPIIPGKPGSRTPDFEEPTTPREPLPPKPDQSGPKPTSPTGAPSRDEQEDQAQQGSWLTTAQGARLYDTDHSLKAGSRGPTLLQDHHLREKITHFDHERIPERVVHARGSAAHGTFISYGNAATITKAAFLAPDVETEVFTRFSSVVGSRGSADAVRDTRGFATKFYTRDGVFDLVGNNIPVFFIQDAIKFPDIVHAAKPHPDREIPQAQSAHDTFWDFVSLHTEATHHTMWQMSDRGIPRSFRMMEGFGIHTFRTENSAGETSLVKFHWKPKAGVHSLIWEEAQMVNGVDPDFHRRDLADAIEAGACPQWELGVQVFPDDPHETFEGIDLLDPTKIVPEELAPVQPLGMLTLNRNPSNFFDETEQVAFHPGHVVPGIDITDDPLLQGRLFSYLDTQLTRLGGPNFSQLPINRPHCPVNDMFRDGMHQTADHRGTAPYKPNSLDGGNPFPAEQTDEHTFVEIAHEIPASKKERRSPESFDDHYSQPRMFWLSLTPVEQQHLADAFTFELGKCYEETIREREVAVLACIDSELARMVAEGLGLEAPAAQTPPRSDIEPSPALSQVGKRWPVDGRKIGIVTGSGTDPEQVIRAYDRIAEAGMVPITIAPVGGRITSGERSVAVERTYLTVASSELDAFFFADGAELTTEIELLITEAWRHLKFIAASGDSCTMMEKYGITADDPGVYCKDDLETALSQLQEGLSEHRAWARVEA
>NZ_CP050153.1|WP_167198798.1|3088145_3088826_-|hypothetical-protein
MNNKMKITGLILAGYMLGRTKKLGLALTVASAVAGTTAAKNRDQLLGGLKDFADSSPELKSLQEKITGRLAESGKSAVKAVAAKGVDQLSVKLQDQTEKMKSTLDDAADSIDPNVDDSEGADDEEDAPESEDESAPENSEEPEADEAEPTDDEQEADDEPQAEEEAPKKPAAKRSSTAKRSAKGTRSSKSSTSSRGSRTKPGSKRSTTAKKTSSRAAAKPEEAEDE
>NZ_CP050153.1|WP_167198801.1|3089098_3090238_-|YbdK-family-carboxylate-amine-ligase
MSEFGIEEEFLLVDQHSLLPARSKSSLQEIEDEVRPSRGAACAEWLPGQIEFATPVLTTAEEAFESLHSFRRGLSAAAQARGLLAVGLGTAPQIPAAPPGVSDGSRYREFAQLAPAIAADQYVNGMHVHVDIPDREAGLRAVNGLRRWIPVLTALSANSPLWRGADSGFASWRSIHYRRWVVFGIPPHFHDLDDYDAQIDAALRSDVVLDEATLGWLVRLSPKHRTVEVRTSDVQLDTATTVTLALLTRALADVAMDDTGPEAVPANLLNIAHWQAARFGLTGMLMDPDTHTSVPAAEVVRKVFHRARPALMRSQDMGRVHRGLRRLLSQGTGSEEQRRVAERQGVGGLLEHAAHRLTASSQDQFEQPADSSRGVSDPP
>NZ_CP050153.1|WP_152347519.1|3090557_3090866_+|hypothetical-protein
MDDQNPKRIDPRSGIAFSDERAIRRRRKLKEAAEFWNMSVAGVWLHYVSLGGDLTEYELDAYLHEAYFLTPYQHDILAEAVNELIDMLPPPPRAPLTDETGL
>NZ_CP050153.1|WP_167198805.1|3090860_3092702_-|MFS-transporter
MSENVELGTIKTDVPARLDRLPWARFHWMVVVGLGSVWILDGLEVTMVGNVAARMTEEGSGIDMTAGQIGTAGAIYVLGACVGAIVFGQLTDRFGRRKLFLITLVLYLVATVATAFSFSAWYFFLVRFLTGAGIGGEYAAVNSAIDELIPARVRGRIDLIINGSYWLGAAGGAATTLFFLNTDILPKMIGWRLAFAVGMLLAIFVFVVRKNVPESPRWLFIHGRNDEAERIVGEIEDGIETETSQTLPPPKKTITVRQRKTISFVEIMKVAFTIYPKRAILCLVLFVGQAFLYNGITFNLGTIFNGFYGVAAATVPIFIILWSLSNFAGPVILGRFFDTIGRKPMISFSYLGSAVVAVVLALVFNTDVGGEWLFLVILIVCFFLASSGASAAYLTVSEIFPMETRALAIAFFYAIGTAAGGIAGPLLFGGMIESGDRSQVAWAFCIGAAVMALGGVAELIFGVKAEGADLEDIARPLTAEDAESAEGAAESSAEPTERGEWADSAEAAEPSASPEARSRGDRLRPGPGSVGVYSPWPSVSSRDVPPEVSANEVNGIIDFVRDMEPVGEVELYRAIGARRWGPGRFRAAVREAIRQGAVHRNRRGRLEYRGDRS
>NZ_CP050153.1|WP_167198808.1|3092902_3094084_-|NAD(P)/FAD-dependent-oxidoreductase
MAEFRYVIIGGGMAADSAAQGIREIDEEGSIAIISDDVDEPYTRPALSKRLWTDESFDESDNYLDTAEATGARISLRTGATAVDVEAKSVRTTHGDFTYDKLLFVTGGRPKGIDLDEGERVICFREFNDYRRLRDLSGRNLSIAVIGGGFIGTELAAALVQNDTRTTLIFDDDTLGGSIFPPDLAKQFHELYRSHGVTLVPGTKASGGHVDGDRVVLDCDGEPHEFDAVVVGLGIEPATQLAEDAGLDTDDGIIVDESLRTSKPDVFAAGDVARYPDRILGRQRVEHVDNATQMGKAVGRIMAGADESYTHTPYFYTNVFDFGYQAVGELDPTLRTVEDWKKPHTDGVVYYLGEDGRVRGVLMVNMEDRLDAAREILGEDWDHTPGDLVTRIS
>NZ_CP050153.1|WP_167198811.1|3094150_3094951_-|SDR-family-oxidoreductase
MDLNIRDRKALVTGASSGIGLETARQLLAEGAVVVMTGPEPDELKAAVDELAEFKERIYAHDADIADDESVDELAASVAAEVGDLDILVNVAGIHGAGGLFHEINQEGWDRTIDVDLMGPVRVTRAFLPGLRRGGWGRIVFVSSEDAVQPYDDELPYCAAKAGMLSLAKGLSRTYASEGLLVNTVSPAFIATPMTDEMMNERAQQKGTSFDEAIASFLREERPFMELGRRGRPEEVAKVIAFLCSDAASFVNGSNYRVDAGSVATI
>NZ_CP050153.1|WP_167198814.1|3094993_3096367_-|NAD-dependent-succinate-semialdehyde-dehydrogenase
MTAKFNTTNPATGEVLKEFPTASDEEISAVIDASDAAFQTWRTTDVRERSAPLARAADLMEERRWDLAELLILEMGKLRAEAEAEVELAARILRYYSEEGPLLLSDEVLAPSSGGSAVMKYEPIGPILGVMPWNFPYYQVVRLAAPNLVAGNTIILKHASNCPQSALAFEQVMNDAQLPSDCYRNVFADSDQIQTIIADERVRGASLTGSEGAGAAVAGAAGHNLKKSILELGGSDPFIVLDSADLDATVTAAVKGRMTNSGQSCIASKRLIVLEEHYREFVDLLTAKMSQFVAGDPRDSATTMAPLSSEQAARDLMEQVQDAIDHGAHVHTGGHRVDRPGAFVEPTVLTGVTEQMRAYSEELFGPVAVVYSVADEDEAVALANDSSFGLGGTVVSDDIEKAQRVADRIDTGMVWINQATWTEPDLPFGGTKRSGVGRELGAEGIREFVNKKLIRTP
>NZ_CP050153.1|WP_167198817.1|3096487_3096949_-|hypothetical-protein
MSLSGLTESAVPTRLCNAMLSGMGSDDDLNSQKSDVTDHKPIVKIFHDDIGVLNQLVKLASEGVPKTALHVFAHDAESTDEVVGADGTLKGLGDLVDERYNERGDELRNRFQRYGFDSDEIEKFESDLDNGAILLVIDDPDLRADYKGNRRAP
>NZ_CP050153.1|WP_167201068.1|3096945_3097419_-|hypothetical-protein
MSPRLDPTTPRHRLGLPVIAIVGLALLAAPRVVLHDLNIIEEGTSVNALFVFLPPLVWIVTVLITRVPRPLITLLAVGLFYGVFLALGHQILWNHSLGDNPPQLGGNLAGLDPTAQSLIFRSFAVASSLLIGVVVGAISGAIAWGLKVLLRRPRNGG
>NZ_CP050153.1|WP_167198820.1|3097755_3098115_-|hypothetical-protein
MSECDPPAWMIRYRNFKTLCSYVCGEFIRFYLTTGCDQIRYTHSQITEGLPNYSCRLTSVDGSVLLLPLDDWVDRLDEVVPMVRTWLGEHSDLKGCKPEKSHYQGDRYWFTRWQEANPW

You can click texts colored in the table to view more detailed information

Click the colored protein region to show detailed information

Self-targeting detection

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_ID	Protospacer_location	Mismatch	Identity

MGE targeting detection<

CRISPR_ID	Spacer_Info	Spacer_region	Spacer_length	Hit_phage_ID	Hit_phage_def	Protospacer_location	Mismatch	Identity
NZ_CP050153_3	3.1\|3087146\|27\|NZ_CP050153\|CRISPRCasFinder	3087146-3087172	27	NZ_CP007796	Azospirillum brasilense strain Az39 plasmid AbAZ39_p3, complete sequence	29698-29724	3	0.889
NZ_CP050153_3	3.1\|3087146\|27\|NZ_CP050153\|CRISPRCasFinder	3087146-3087172	27	NZ_CP023068	Ensifer sojae CCBAU 05684 plasmid pSJ05684b, complete sequence	201127-201153	4	0.852
NZ_CP050153_3	3.1\|3087146\|27\|NZ_CP050153\|CRISPRCasFinder	3087146-3087172	27	MT657336	Microbacterium phage ClearAsMud, complete genome	13374-13400	4	0.852
NZ_CP050153_1	1.1\|1679027\|26\|NZ_CP050153\|CRISPRCasFinder	1679027-1679052	26	NZ_CP043441	Cupriavidus campinensis strain MJ1 plasmid unnamed1, complete sequence	1430349-1430374	5	0.808
NZ_CP050153_3	3.1\|3087146\|27\|NZ_CP050153\|CRISPRCasFinder	3087146-3087172	27	NZ_CP022418	Sulfitobacter pseudonitzschiae strain SMR1 plasmid pSMR1-3, complete sequence	155984-156010	5	0.815
NZ_CP050153_3	3.1\|3087146\|27\|NZ_CP050153\|CRISPRCasFinder	3087146-3087172	27	NZ_CP035092	Paracoccus denitrificans strain ATCC 19367 plasmid unnamed1, complete sequence	26841-26867	6	0.778
NZ_CP050153_3	3.1\|3087146\|27\|NZ_CP050153\|CRISPRCasFinder	3087146-3087172	27	NC_008688	Paracoccus denitrificans PD1222 plasmid 1, complete sequence	274188-274214	6	0.778
NZ_CP050153_3	3.1\|3087146\|27\|NZ_CP050153\|CRISPRCasFinder	3087146-3087172	27	NC_009717	Xanthobacter autotrophicus Py2 plasmid pXAUT01, complete sequence	178368-178394	6	0.778
NZ_CP050153_3	3.1\|3087146\|27\|NZ_CP050153\|CRISPRCasFinder	3087146-3087172	27	NC_007486	Rhodococcus erythropolis PR4 plasmid pREC1, complete sequence	40415-40441	6	0.778
NZ_CP050153_3	3.1\|3087146\|27\|NZ_CP050153\|CRISPRCasFinder	3087146-3087172	27	NZ_CP020698	Sulfitobacter sp. D7 plasmid p4SUD7, complete sequence	82808-82834	7	0.741

1. spacer 3.1|3087146|27|NZ_CP050153|CRISPRCasFinder matches to NZ_CP007796 (Azospirillum brasilense strain Az39 plasmid AbAZ39_p3, complete sequence) position: , mismatch: 3, identity: 0.889

ctccgcgtcgcctgcctcggccggttc	CRISPR spacer
caccgcgtcggctgccccggccggttc	Protospacer
* ******** *****.**********

2. spacer 3.1|3087146|27|NZ_CP050153|CRISPRCasFinder matches to NZ_CP023068 (Ensifer sojae CCBAU 05684 plasmid pSJ05684b, complete sequence) position: , mismatch: 4, identity: 0.852

ctccgcgtcgcctgcctcggccggttc	CRISPR spacer
ctccgcgtcgcctgcctcggcgcaatc	Protospacer
*********************  . **

3. spacer 3.1|3087146|27|NZ_CP050153|CRISPRCasFinder matches to MT657336 (Microbacterium phage ClearAsMud, complete genome) position: , mismatch: 4, identity: 0.852

ctccgcgtcgcctgcctcggc--cggttc	CRISPR spacer
ctcctcgtcgcctgcctcggcgtcggg--	Protospacer
**** ****************  ***

4. spacer 1.1|1679027|26|NZ_CP050153|CRISPRCasFinder matches to NZ_CP043441 (Cupriavidus campinensis strain MJ1 plasmid unnamed1, complete sequence) position: , mismatch: 5, identity: 0.808

cttgaacgaggtagcccgggtgggcg	CRISPR spacer
ggcgaaggaggtggcccgggtgggcg	Protospacer
  .*** *****.*************

5. spacer 3.1|3087146|27|NZ_CP050153|CRISPRCasFinder matches to NZ_CP022418 (Sulfitobacter pseudonitzschiae strain SMR1 plasmid pSMR1-3, complete sequence) position: , mismatch: 5, identity: 0.815

ctccgcgtcgcctgcctcggccggttc	CRISPR spacer
aatcgcggcgcctgcctcggccgcttc	Protospacer
  .**** *************** ***

6. spacer 3.1|3087146|27|NZ_CP050153|CRISPRCasFinder matches to NZ_CP035092 (Paracoccus denitrificans strain ATCC 19367 plasmid unnamed1, complete sequence) position: , mismatch: 6, identity: 0.778

ctccgcgtcgcctgcctcggccggttc	CRISPR spacer
atcctcgccgcctgcctcggccgggcg	Protospacer
 *** **.**************** .

7. spacer 3.1|3087146|27|NZ_CP050153|CRISPRCasFinder matches to NC_008688 (Paracoccus denitrificans PD1222 plasmid 1, complete sequence) position: , mismatch: 6, identity: 0.778

ctccgcgtcgcctgcctcggccggttc	CRISPR spacer
atcctcgccgcctgcctcggccgggcg	Protospacer
 *** **.**************** .

8. spacer 3.1|3087146|27|NZ_CP050153|CRISPRCasFinder matches to NC_009717 (Xanthobacter autotrophicus Py2 plasmid pXAUT01, complete sequence) position: , mismatch: 6, identity: 0.778

ctccgcgtcgcctgcctcggccggttc	CRISPR spacer
ctccgcgtcgcctgccttggcgaaatg	Protospacer
*****************.*** .. *

9. spacer 3.1|3087146|27|NZ_CP050153|CRISPRCasFinder matches to NC_007486 (Rhodococcus erythropolis PR4 plasmid pREC1, complete sequence) position: , mismatch: 6, identity: 0.778

ctccgcgtcgcctgcctcggccggttc	CRISPR spacer
acaggcgttgcctgcctctgccggttc	Protospacer
 .  ****.********* ********

10. spacer 3.1|3087146|27|NZ_CP050153|CRISPRCasFinder matches to NZ_CP020698 (Sulfitobacter sp. D7 plasmid p4SUD7, complete sequence) position: , mismatch: 7, identity: 0.741

ctccgcgtcgcctgcctcggccggttc	CRISPR spacer
gaatgcgtcgcctgcctcggcctgtgt	Protospacer
   .****************** ** .

Prophage detection

Region

Region Position

Protein_number

Hit_taxonomy

Key_proteins

Att_site

Prophage annotation

DBSCAN-SWA_1

2710856 : 2733531

Brevibacterium_phage(77.78%)

terminase,tail,head

The bacterium proteins that are colored denote the protein is present at specific phage-related keywords (such as 'capsid', 'head', 'integrase', 'plate', 'tail', 'fiber', 'coat', 'transposase', 'portal', 'terminase', 'protease' or 'lysin' and 'tRNA')

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
WP_167197910.1\|2710856_2711738_-	hypothetical protein	A0A0K1Y5A0	Streptomyces_phage	8.1e-20	32.6
WP_167197913.1\|2711730_2712882_-	DUF5047 domain-containing protein	A0A2P1CI87	Actinomyces_phage	1.1e-08	28.7
WP_167197916.1\|2712892_2714080_-	hypothetical protein	NA	NA	NA	NA
WP_167197919.1\|2714391_2720568_-\|tail	phage tail tape measure protein	A0A249XNT7	Brevibacterium_phage	0.0e+00	47.6
WP_167197922.1\|2720615_2720882_+	hypothetical protein	NA	NA	NA	NA
WP_167197925.1\|2720882_2721104_-	hypothetical protein	A0A249XNN2	Brevibacterium_phage	5.5e-18	59.2
WP_167197930.1\|2721193_2721856_-	deoxyribodipyrimidine photo-lyase	A0A249XNU1	Brevibacterium_phage	4.4e-63	61.3
WP_167197933.1\|2721985_2722513_-	hypothetical protein	A0A249XNM8	Brevibacterium_phage	2.9e-41	53.5
WP_167197936.1\|2722505_2722721_-	hypothetical protein	NA	NA	NA	NA
WP_167197939.1\|2722814_2722997_+	hypothetical protein	NA	NA	NA	NA
WP_167197942.1\|2723047_2723458_-	hypothetical protein	A0A249XNM0	Brevibacterium_phage	2.4e-43	65.9
WP_167200982.1\|2723454_2723757_-	hypothetical protein	A0A249XNM6	Brevibacterium_phage	8.5e-30	65.6
WP_167197946.1\|2723819_2724230_-	HNH endonuclease	G9FH57	Rhodococcus_phage	6.8e-30	63.6
WP_167197948.1\|2724229_2724670_-	hypothetical protein	A0A249XNN1	Brevibacterium_phage	1.9e-33	53.8
WP_167197950.1\|2724666_2725032_-	hypothetical protein	A0A249XQ72	Brevibacterium_phage	2.1e-30	61.9
WP_167197952.1\|2725110_2726202_-	hypothetical protein	A0A249XNM5	Brevibacterium_phage	8.3e-75	45.7
WP_143924201.1\|2726228_2726570_-	DUF2190 family protein	A0A249XNM3	Brevibacterium_phage	9.6e-38	71.9
WP_167197954.1\|2726571_2727807_-	hypothetical protein	A0A249XNL5	Brevibacterium_phage	1.3e-100	56.2
WP_167197956.1\|2727803_2728856_-\|head	phage head morphogenesis protein	A0A249XNT1	Brevibacterium_phage	3.2e-116	61.3
WP_167197959.1\|2728868_2730419_-	hypothetical protein	A0A249XNL8	Brevibacterium_phage	4.1e-184	61.7
WP_167200985.1\|2730434_2731913_-\|terminase	phage terminase large subunit	A0A249XNL6	Brevibacterium_phage	1.5e-156	54.1
WP_167197961.1\|2732743_2733373_-	hypothetical protein	NA	NA	NA	NA
WP_167197963.1\|2733369_2733531_-	hypothetical protein	A0A160DH94	Gordonia_phage	2.0e-06	54.2

DBSCAN-SWA_2

2737669 : 2755216

Gordonia_phage(35.71%)

integrase

attL 2735242:2735257|attR 2753331:2753346

Protein_ID	Protein_Def	Hit_ID	Hit_Def	E-value	Identity
2735242:2735257	attL	NA	NA	NA	NA
WP_167198001.1\|2737669_2738947_-	AAA family ATPase	V5R9D2	Arthrobacter_phage	4.5e-64	36.3
WP_167198004.1\|2738946_2739639_-	hypothetical protein	A0A142K976	Gordonia_phage	5.7e-13	35.7
WP_167198007.1\|2739639_2739804_-	hypothetical protein	NA	NA	NA	NA
WP_167198010.1\|2740260_2740638_-	hypothetical protein	A0A173G9J6	Propionibacterium_phage	1.1e-21	44.7
WP_167198013.1\|2740634_2740976_-	hypothetical protein	NA	NA	NA	NA
WP_167198016.1\|2740979_2741336_-	hypothetical protein	NA	NA	NA	NA
WP_167198019.1\|2741332_2742043_-	hypothetical protein	A0A159B6E8	Gordonia_phage	7.7e-13	35.7
WP_167198022.1\|2742246_2742534_-	hypothetical protein	NA	NA	NA	NA
WP_167198025.1\|2742530_2742848_-	hypothetical protein	NA	NA	NA	NA
WP_167198029.1\|2742888_2743407_-	single-stranded DNA-binding protein	A0A0U4B2E8	Arthrobacter_phage	9.5e-45	76.9
WP_167198032.1\|2743409_2744264_-	recombinase RecT	A0A286N2W1	Arthrobacter_phage	2.7e-68	55.6
WP_167198035.1\|2744260_2745193_-	hypothetical protein	A0A1I9SCY4	Arthrobacter_phage	8.7e-57	41.9
WP_167198038.1\|2745350_2745545_-	hypothetical protein	NA	NA	NA	NA
WP_167198041.1\|2745541_2745757_-	hypothetical protein	NA	NA	NA	NA
WP_167198044.1\|2745753_2745972_-	hypothetical protein	NA	NA	NA	NA
WP_167198047.1\|2745968_2746151_-	hypothetical protein	NA	NA	NA	NA
WP_167198050.1\|2746147_2746414_-	hypothetical protein	NA	NA	NA	NA
WP_167198053.1\|2746410_2746812_-	hypothetical protein	NA	NA	NA	NA
WP_167200987.1\|2746808_2747597_-	hypothetical protein	W6AT80	Mycobacterium_phage	4.8e-48	46.7
WP_167198056.1\|2747666_2747948_-	hypothetical protein	NA	NA	NA	NA
WP_167198059.1\|2748189_2748741_+	hypothetical protein	NA	NA	NA	NA
WP_167198062.1\|2748737_2749535_+	DUF3800 domain-containing protein	NA	NA	NA	NA
WP_167198066.1\|2749723_2750134_+	ImmA/IrrE family metallo-endopeptidase	A0A142K9K0	Gordonia_phage	1.3e-12	38.4
WP_167198069.1\|2750138_2751236_+\|integrase	site-specific integrase	A0A0E3XBN7	Gordonia_phage	5.5e-58	37.1
WP_167198072.1\|2751294_2752266_-	class 1b ribonucleoside-diphosphate reductase subunit beta	A0A160DHK0	Gordonia_phage	2.8e-146	81.1
WP_167198075.1\|2752422_2754585_-	class 1b ribonucleoside-diphosphate reductase subunit alpha	V9VI16	Lactococcus_phage	3.2e-211	52.4
2753331:2753346	attR	NA	NA	NA	NA
WP_167198078.1\|2754554_2754968_-	class Ib ribonucleoside-diphosphate reductase assembly flavoprotein NrdI	G3MBF1	Bacillus_virus	1.2e-13	34.6
WP_025778731.1\|2754970_2755216_-	glutaredoxin-like protein NrdH	V5UN81	Mycobacterium_phage	7.9e-18	51.9

Anti-CRISPR protein detection

Acr ID	Acr position	Acr size	Homology with known anti	Neighbor HTH/AcRanker	Neighbor Aca	In prophage	Protospacer in prophage

Overview of predicted results

Overview of the results

Cas Category Instructions

Results visualization

1. NZ_CP050153

Click the left colored region to show detailed information

CRISPR-Cas detection and classification

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Click the colored protein region to show detailed information

Self-targeting detection

MGE targeting detection<

Prophage detection

Anti-CRISPR protein detection