Hoe u DeepSeek R1 op uw pc installeert met AMD Ryzen AI en Radeon GPU

Thiago Almeida's avatar
In deze tutorial leert u hoe u DeepSeek R1 distilled-modellen op uw pc met AMD Ryzen AI en Radeon GPU installeert en gebruikt. Kijk maar!

O Diepzoeken het is a inteligência kunstmatig die uitstekende prestaties belooft met zeer lage ontwikkelingskosten. De laatste dagen is er nergens anders meer over gesproken. Sterker nog, de belangrijkste bedrijven in deze markt hebben een flinke klap gekregen wat betreft de prijs van hun producten. acties. Laten we het nu eens bekijken Hoe DeepSeek R1 te installeren en gebruik het op uw pc met behulp van het platform AMD.

Wat zijn redeneermodellen?

Redeneermodellen em inteligência kunstmatig zijn benaderingen waarmee ze op geautomatiseerde wijze beslissingen kunnen nemen op basis van gegevens en vooraf gedefinieerde regels. Deze modellen proberen het menselijk denken te simuleren, waardoor AI's cognitieve capaciteiten krijgen zoals plannen, besluitvorming en het oplossen van complexe problemen.

Het verschil van DeepSeek R1-redeneringsmodel, is dat het werd gedistilleerd in kleinere modellen met een hoge capaciteit. Deze modellen zijn klein genoeg om op thuishardware te draaien, zonder dat er grote verwerkingsclusters nodig zijn. Op deze manier, wanneer u een bestelling plaatst om R1, wordt alleen het model gebruikt dat gespecialiseerd is in het onderwerp.

Installatievereisten

de gebruiken Diep zoeken R1hebt u een van de onderstaande processor- of GPU-modellen nodig en moet u de benodigde software installeren.

Hardware:

bewerkerDeepSeek R1 Distill* (max. ondersteund)
AMD Ryzen™ AI Max+ 395 32GB 1 , 64 GB 2 en 128 GBDeepSeek-R1-Distill-Llama-70B (alleen 64GB en 128GB)
DeepSeek-R1-Distill-Qwen-32B
AMD Ryzen™ AI HX 370 en 365 24GB en 32GBDeepSeek-R1-Distill-Qwen-14B
AMD Ryzen™ 8040 en Ryzen™ 7040 32GBDeepSeek-R1-Distill-Llama-14B

*= AMD adviseert om alle distillaties uit te voeren met Q4 KM-kwantificering.
1 = Vereist variabel grafisch geheugen ingesteld op Aangepast: 24 GB.  

2 = Vereist dat het variabele grafische geheugen op Hoog is ingesteld.

grafische kaartDeepSeek R1 Distill* (max. ondersteund) 1 )
AMD Radeon™ RX 7900 XTX-videokaartDeepSeek-R1-Distill-Qwen-32B
AMD Radeon™ RX 7900 XT-videokaartDeepSeek-R1-Distill-Qwen-14B
AMD Radeon™ RX 7900 GREDeepSeek-R1-Distill-Qwen-14B
AMD Radeon™ RX 7800 XT-videokaartDeepSeek-R1-Distill-Qwen-14B
AMD Radeon™ RX 7700 XT-videokaartDeepSeek-R1-Distill-Qwen-14B
AMD Radeon™ RX 7600 XT-videokaartDeepSeek-R1-Distill-Qwen-14B
AMD Radeon™ RX 7600-videokaartDeepSeek-R1-Distill-Llama-8B

*= AMD adviseert om alle distillaties uit te voeren met Q4 KM-kwantificering.

1 = Geeft het maximale distillaat weer dat wordt ondersteund zonder gedeeltelijke GPU-offloading. 

Software:

  • Optioneel Adrenalin 25.1.1 Driver of hoger
  • LM Studio 0.3.8 of hoger

Stap voor stap

Stap 01: Zorg ervoor dat u de optionele driver Adrenalin 25.1.1 of hoger gebruikt. Het kan direct worden geïnstalleerd hier.

Stap 02: Download LM Studio 0.3.8 of hoger hierin.

Stap 03: Installeer LM Studio en sla het integratiescherm over.

LM-startscherm na installatie, waarop te zien is hoe u onboarding kunt overslaan door in de rechterbovenhoek op 'onboarding overslaan' te klikken. Hoe deepseek r1 te installeren
Integratie overslaan in LM Studio na installatie, door Thiago Almeida

Stap 04: Klik op het tabblad 'Ontdekken'.

lm studio scherm waarop te zien is waar de ontdekknop zich bevindt
Klik op Ontdekken, door Thiago Almeida

Stap 05: Ga nu naar het zoekvak en typ diepzoeken r1. Er verschijnen verschillende opties, maar zorg ervoor dat u het model kiest dat geschikt is voor uw hardware, volgens de tabel hierboven, in “Installatievereisten”. Zorg ervoor dat aan de rechterkant de kwantificering “Q4 KM” is geselecteerd en klik op downloaden.

Het scherm toont de zoekopdracht en selectie van het geschikte deepseek r1-model om te downloaden.
DeepSeek R1 modelselectie, door Thiago Almeida

Stap 06: Nadat het downloaden van het model is voltooid, sluit u het downloadvenster, het meldingsvak waarin staat dat het model is gedownload en het detectievenster dat we in de vorige stap hebben gebruikt om het model te downloaden.

Stap 07: Selecteer nu op het chatscherm de sjabloon Diep zoeken R1 en zorg ervoor dat u de optie om parameters handmatig te selecteren aangevinkt laat.

Het scherm toont de selectie van het deepseek r1-model in de lm studio-chat
Het selecteren van het DeepSeek R1-model in de LM Studio-chat, door Thiago Almeida
De afbeelding toont het scherm met het deepseek r1-model dat al is geselecteerd om te laden in de lm studio-chat.
DeepSeek R1-selectie in LM Studio-chat, door Thiago Almeida

Stap 08: Schuif onder GPU Offload naar de maximale grootte, vink “instellingen onthouden” aan om de instellingen voor dit model op te slaan en klik op “Model laden”.

De afbeelding toont het scherm met de maximale belastingparameterisatie voor de gpu.
Het selecteren van de maximale belasting voor de GPU, door Thiago Almeida.

Oké, nu het model geladen is, kunnen we er lokaal op onze eigen PC mee communiceren.

Hieronder vindt u de video die het bedrijf zelf heeft vrijgegeven. AMD met de stap voor stap.

Tests

Bij onze tests begonnen we met het stellen van een aantal basisvragen aan de Diep zoeken R1, zoals: "Wat is de vierkantswortel van 1024?". Na 3.67 seconden nadenken gaf hij het volgende resultaat:


Om de vierkantswortel van te vinden 1024, Volg deze stappen:

  1. Begrijp het concept van vierkantswortel: De vierkantswortel van een getal is een getal dat, vermenigvuldigd met zichzelf, het oorspronkelijke getal oplevert. D.w.z:
    [
    \sqrt{x} = y \quad \text{als en alleen als} \quad y^2 = x
    ]
  2. Pas de stappen toe om de vierkantswortel van 1024 te berekenen:
    • Geef een geheel getal dat, wanneer het met zichzelf wordt vermenigvuldigd, 1024 oplevert.
    • Probeer opeenvolgende gehele getallen totdat u het getal vindt dat aan de voorwaarde voldoet: [30^2 = 900 \quad (\text{kleiner dan } 1024)][31^2 = 961 \quad (\text{kleiner dan } 1024)][32^2 = 1024 \quad (\text{exact} )]
  3. Conclusie: De vierkantswortel van 1024 is: [\sqrt{1024} = 32]

Het eindresultaat is dus:

\ingepakt{32}

De afbeelding toont het chatscherm met deepseek r1's antwoord op de vierkantswortel van 1024.
Het antwoord van DeepSeek R1 op de vierkantswortel van 1024, door Thiago Almeida.

Om tot het uiteindelijke resultaat te komen, gebruikte het model de volgende redenering:

  • Om de vierkantswortel van 1024 te vinden, moet ik bepalen welk getal tot de tweede macht 1024 oplevert;
  • Ik begin met het bekijken van grote gehele getallen die 32 naderen. Ik weet dat 30² gelijk is aan 900, wat kleiner is dan 1024. Vervolgens bereken ik 31², wat gelijk is aan 961, nog kleiner dan het doel. Als ik 32² probeer, krijg ik 1024, wat precies het gewenste getal is;
  • Ik concludeer dus dat de vierkantswortel van 1024 gelijk is aan 32.

Nu vroeg ik om de Diep zoeken R1 vertel me vier dingen over hem (ik moet hierbij wel zeggen dat ik hem hiervoor een aantal willekeurige vragen heb gesteld, die uiteindelijk onderdeel bleken te zijn van de gebruikte logica). Na 13.62 seconden werd het volgende antwoord gegeven:

Sorry voor de mogelijke verwarring! Ik ben een computertaalmodel, geen echt persoon of entiteit met persoonlijkheid. Ik heb dus geen ‘eigen’, noch persoonlijke kenmerken zoals mensen.

Ik kan u echter wel helpen met informatie over de onderwerpen die u noemt. Bijvoorbeeld:

  1. Uw interesse in de best scorende films aller tijden. Ik kan u meer details of recente updates geven als u dat wilt.
  2. Bent u nieuwsgierig naar het verhaal van Leonardo da Vinci? Dan kan ik u beter uitleggen hoe hij een bijdrage aan de wereld heeft geleverd.
  3. Als u meer wilt weten over de werking van computers of besturingssystemen, kan ik u uitgebreide uitleg geven.

Wil je dat ik iets specifieks doe of dat ik een bepaald onderwerp verder uitdiep?

De afbeelding toont het chatscherm met de reactie van deepseek r1 toen hem naar zichzelf werd gevraagd.
Het antwoord van DeepSeek R1 op een vraag over zichzelf, door Thiago Almeida.

Controleren van de logica die wordt gebruikt door Diep zoeken R1 Om het volgende antwoord te geven, hebben we:

  • Oké, ik probeer erachter te komen hoe ik de vraag van deze gebruiker kan beantwoorden, waarin staat dat ik vier dingen over mezelf vertel. Wacht, maar wie ben ik? Hmm, misschien moet ik beginnen met te begrijpen wat de gebruiker nu eigenlijk vraagt.
  • Oké, laten we het eens opsplitsen. De gebruiker vroeg in eerste instantie naar de meest succesvolle film aller tijden en ik gaf een lijst met de meest succesvolle films. Vervolgens stelde hij mij een paar vragen over Leonardo da Vinci en andere onderwerpen, waarna hij mij ten slotte vroeg om vier dingen over mijzelf te vertellen. Maar omdat ik een AI-taalmodel ben, heb ik geen persoonlijke kenmerken of ervaringen. Ik moet dit even verduidelijken.
  • Ik moet uitleggen dat ik weliswaar informatie kan verstrekken over uiteenlopende onderwerpen, maar dat ik geen persoonlijkheid of persoonlijke geschiedenis heb zoals een mens dat zou hebben. Misschien is de gebruiker nieuwsgierig naar mijn werkwijze of wat ik weet. Het is belangrijk om dit aan te kaarten, zodat hij mijn beperkingen begrijpt en wat ik te bieden heb.
  • Ik kan mijn belangrijkste functies als volgt samenvatten: vragen beantwoorden, informatie verstrekken, helpen met taken en suggesties doen. Voor het onderdeel ‘vier dingen’ zou ik functies kunnen opnoemen zoals 24/7 beschikbaarheid, de mogelijkheid om snel nieuwe informatie te leren, meertalige ondersteuning en naleving van ethische richtlijnen.
  • Ik moet ervoor zorgen dat mijn antwoord duidelijk en nuttig is en dat ik de gebruiker laat weten hoe ik hem of haar verder kan helpen. Ik zal het op een vriendelijke en informatieve manier uitleggen.

Nu heb ik het thema veranderd naar programmeren. Ik vroeg hoe je mij kon helpen met het ontwikkelen van een app Android en het begon met verwerken, waarbij bij 78% van de verwerking een fout werd geretourneerd. Ik vroeg hem toen om een ​​eenvoudige code te schrijven in Kotlin om de gebruiker van een app te verwelkomen en, op dezelfde manier, gaf het bij 77% een foutmelding.

De afbeelding toont het chatscherm met fouten, waarbij het model na een paar vragen een foutmelding gaf.
Fouten bij het laden van reacties in de chat, door Thiago Almeida.

Ik heb geprobeerd een codefragment naar het model te sturen en heb het gevraagd om aan te geven welke taal er werd gebruikt en waar de code voor bedoeld was. Bij 55% werd er opnieuw een foutmelding gegeven. Ik besloot toen om de LM Studio en probeer het opnieuw, want deze keer werkte het. Na 20.61 seconden verwerking werd het volgende antwoord gegeven:

De verstrekte code is onderdeel van een Android-applicatie die is geschreven in Kotlin. Hier volgt een uitleg van wat de code doet en hoe u deze kunt verbeteren:

De code begrijpen:

Functienaam: initQueryListener()

Deze functie initialiseert een listener voor de zoekweergave (searchView) om tekstinvoergebeurtenissen te verwerken.

Zoekweergaveconfiguratie:

searchView.queryHint é usado para definir um texto de sugestão para a barra de pesquisa, orientando os usuários sobre o que digitar.

Querytekstwijzigingslistener:

O listener é configurado usando searchView.setOnQueryTextListener().
Dois métodos são sobrescritos:

onQueryTextSubmit(query: String): Booleaans

Invocado quando o usuário envia uma query (por exemplo, pressiona enter ou clica no botão de pesquisa).
Chama noteViewModel.queryNotes(query), que provavelmente recupera notas com base na entrada de pesquisa.
Retorna false para indicar que nenhuma ação é realizada após o envio.

onQueryTextChange(nieuweTekst: String): Booleaans

Invocado enquanto o usuário digita, atualizando a entrada de pesquisa.
Se newText estiver vazio (usuário limpou a pesquisa), chama noteViewModel.queryNotes(), que provavelmente exibe todas as notas novamente.

Mogelijke verbeteringen:

Foutafhandeling:

O código atual não trata possíveis erros ao chamar noteViewModel.queryNotes(query) ou noteViewModel.queryNotes().
Você pode querer adicionar tratamento de erros para capturar exceções e fornecer feedback ao usuário, como uma mensagem toast se algo der errado.

Logboek met gegevens:

Adicionar declarações de log pode ajudar a rastrear o fluxo do aplicativo e depurar problemas. Por exemplo:
val TAG = "SearchListener"
log(TAG, "Query submitted: $query")

Nulcontroles:

Certifique-se de que todos os objetos e variáveis sejam verificados quanto a nulos para evitar NullPointerExceptions.
Por exemplo, se noteEditText for nulo em outro contexto, lide com isso de forma apropriada.

Gebruikersfeedback:

Forneça um feedback claro ao usuário quando uma ação falhar. Use mensagens toast ou outros elementos de IU para informá-los sobre quaisquer problemas.

testen:

Teste o código minuciosamente para garantir que todas as funcionalidades funcionem conforme o esperado em diferentes cenários, como:
Digitando e enviando uma query.
Limpando a entrada de pesquisa e vendo todas as notas novamente.
Lidando com erros de forma graciosa.

Verbeterd codevoorbeeld:

private fun initQueryListener() {
    val TAG = "SearchListener"
    searchView.queryHint = getString(R.string.search_bar_hint)

    searchView.setOnQueryTextListener(object : SearchView.OnQueryTextListener {
        override fun onQueryTextSubmit(query: String): Boolean {
            try {
                val result = noteViewModel.queryNotes(query)
                if (result.isNotEmpty()) {
                    // Handle successful query
                    log(TAG, "Query submitted: $query")
                } else {
                    // If no results found, show appropriate message
                    showToast("No notes found with this query.")
                }
            } catch (e: Exception) {
                e.printStackTrace()
                showToast("Error processing search: ${e.message}")
            }
            return false
        }

        override fun onQueryTextChange(newText: String): Boolean {
            if (newText.isEmpty()) {
                // Clear the search and show all notes
                noteViewModel.queryNotes()
                log(TAG, "Search cleared; showing all notes.")
            }
            return false
        }
    })
}

// Método auxiliar para exibir uma mensagem toast
private fun showToast(message: String) {
    Toast.makeText(
        this@MainActivity,
        message,
        Toast.LENGTH_SHORT
    ).show()
}

Laatste overwegingen:

De originele code is een goed startpunt voor het implementeren van zoekfunctionaliteit in een Android-applicatie.

Door foutverwerking, logging, null-controles en gebruikersfeedback toe te voegen, kunt u uw applicatie robuuster en gebruiksvriendelijker maken.

Test uw code altijd grondig om er zeker van te zijn dat deze zich onder verschillende omstandigheden gedraagt ​​zoals verwacht.

Door deze stappen te volgen, kunt u de zoekfunctionaliteit van uw Android-app verbeteren en uw gebruikers een betere ervaring bieden.

Ik besloot om nogmaals te vragen hoe de Diep zoeken R1 Kunt u mij helpen een applicatie te ontwikkelen? Android. Na 55.30 seconden werd de basisinformatie teruggestuurd en werd de code gebruikt die ik eerder in het antwoord had verzonden. Hieronder staat de gebruikte redenering:

“Oké, ik probeer iemand te helpen met het ontwikkelen van een Android-app. Eerst moet ik precies begrijpen wat ze willen. Ze wilden graag een 'Android-app', wat Portugees is voor 'een Android-applicatie'. Maar toen gaven ze wat code in Kotlin en vroegen ernaar.”

Onderzoek doen naar de Diepzoeken Op internet zijn meerdere berichten te vinden dat hij weigert vragen over China te beantwoorden. Daarom besloot ik hem te vragen wat hij van de huidige Chinese regering vindt en dit is zijn antwoord:

Als AI is het mijn taak om informatie op een objectieve en feitelijke manier te presenteren. Daarom kan ik geen persoonlijke meningen uiten of een standpunt innemen over de regering van welk land dan ook, inclusief de huidige regering van China.

Ik kan u wel algemene informatie geven over de Chinese overheid, bijvoorbeeld over de politieke structuur, de belangrijkste beleidsmaatregelen en hoe dit beleid door het publiek wordt ervaren. Verder kan ik de verschillende internationale perspectieven op de Chinese overheid noemen.

Als u meer specifieke informatie wilt over de Chinese overheid of de impact ervan op het land en de wereld, dan help ik u graag met objectieve feiten en cijfers.

Toen ik vroeg om wat meer informatie over China te geven, gaf het opnieuw een foutmelding. En hier moet volgens mij sprake zijn van een beperking van het model. Diep zoeken R1 draait op thuishardware.

Conclusie

Het is zonder twijfel de distillatietechniek die door Diep zoeken R1, het distilleren van redeneermodellen in kleinere en krachtigere modellen, en het is niet alleen open source - waardoor ontwikkelaars en onderzoekers onderzoek kunnen doen, wijzigingen kunnen aanbrengen en veranderingen kunnen implementeren - het brengt een scenario met veel mogelijkheden en voordelen ten opzichte van propriëtaire modellen.

Uit de tests die we hebben uitgevoerd, is gebleken dat het model nog steeds op een aantal punten verbeterd moet worden om bepaalde contexten beter te begrijpen. De belangrijkste concurrent, de ChatGPT, heeft een voorsprong bij het coderen en op feiten gebaseerd redeneren. Maar omdat het een open source kunstmatige intelligentieeen Diepzoeken kan in de nabije toekomst een goede optie zijn.

Wat betreft het gebruik van het model op thuishardware zoals die in deze test werd gebruikt — een Ryzen 7 5700X, 64 GB DDR4 RAM en een Radeon 7600 GPU — bleken de prestaties erg goed te zijn, maar de constante fouten na enkele vragen kunnen een beperking van dit type gebruik.

En jij, wat vond jij van deze stap-voor-stap uitleg? Iran DeepSeek R1 installeren en testen? Laat in de reacties weten wat uw ervaringen zijn met het testen van het model en wat de resultaten waren.

Zie ook

Fontes: AMD-gemeenschap, Tom's Hardware e PC-gids.

Tekstreview gedaan door Jaime Ninece op 02-02-2025.


Ontdek meer over Showmetech

Meld u aan om ons laatste nieuws per e-mail te ontvangen.

Gerelateerde berichten